Main Business
本產品通過全新的技術手段,從卷宗電子化的數據源頭實現卷宗的全樣本精準識別、自動分類、關鍵信息提取、自動編目,滿足卷宗電子閱卷、文書制作、類案推送、自動編目等深度應用的數據應用需求及數據真實需求,進而提高人民法院審判工作效率及司法公信度。
本產品對卷宗材料中對識別有影響的干擾因素進行自適應規避,識別引擎需能夠自適應的干擾因素包括但不限于:證件復印件底紋、證件復印件底灰、文字劃線、表格線、文字上方扣章、版面污損、版面噪聲、文本扭曲等。識別時可將此部分干擾項去除,對干擾項下的文字進行有效識別,保證電子卷宗內容的完整性及可用性。
利用與高速掃描儀及高清拍照儀的硬件對接,實現對紙質卷宗的影像采集功能,平臺將卷宗掃描及卷宗拍照兩種加工模式進行融合,使操作人員在卷宗加工過程中無需切換,提高卷宗加工整體性及加工效率,相比傳統加工模式效率提高40%以上。
本產品通過對海量手寫材料訓練分析,能夠根據手寫文字特征輸出對應識別結果,并綜合字符分類的置信度、語言上下文、幾何上下文等各方面的信息輸出最佳識別結果,識別準確率可達95%以上。
本產品采用能夠對文本類型進行區分,可根據不同文本類型采用不同識別技術進行識別,并將識別結果進行拼接,保證混合材料的識別結果整體性及有效性。
本產品通過采用表格分析方法分析表格的邏輯結果,對表格中存在的文字進行識別,最后得到對識別結果做后處理,保證識別結果不受表格線等干擾項影響,保證識別準確率。
本產品能夠基于深度學習技術,利用光學字符識別技術實現多種卡證的識別,無需提前告知卡證的類別,即可進行高效準確的識別,適用于多種卡證同時識別的需求,包括:身份證、銀行卡、駕照、行駛證、名片、火車票、出租車票、營業執照、郵政EMS快遞單、律師證、戶籍證、房產證、組織機構代碼、國稅地稅增值稅發票等。
本產品能夠對卷宗中存在的非文本內容進行提取,如公章(方章、圓章、異形章)、指印、簽字等,引擎能夠對文本內容及非文本內容進行正確區分,保證卷宗中非文本內容的精確檢測。