Core Technology
漢王要素抽取引擎,基于深度學習和自然語言處理技術,可適用于一切需要從非結構化數據(普通文檔)中進行結構化數據抽取的業務場景,包括:卡證、名片、發票、憑證、財務報表、合同、論文、登記表格等,抽取的要素包括但不限于:人名、地址、時間、機構、金額、編號、標題、關鍵詞、數字,可處理的文檔格式包括:Txt、Word、Excel、PDF、圖像文件等。
漢王基于深度學習的知識圖譜建設和管理系統,可從非結構化數據中抽取知識,包括人名、機構、職位、事件、時間、地點等實體,包括人物籍貫、人物生卒日期等屬性,包括人物親屬關系、人物擔任職位、職位從屬機構、人物參與歷史事件等關系,構建知識圖譜、知識挖掘、知識推理、知識問答。已應用于檔案和文教行業,業務場景包括民國歷史人物圖譜、人事檔案履歷圖譜、機構設立遷址圖譜等。
漢王機器翻譯平臺,使用基于深度學習的自然語言處理技術,已實現將自然語言翻譯為結構化查詢語言(Structured Query Language,簡稱SQL)的功能,可擴展為其它語種之間的翻譯平臺,例如中文翻譯為英文、英文翻譯為中文等。漢王機器翻譯平臺,支持知識圖譜查詢、應用系統查詢、結構化數據查詢,為自動問答提供語言翻譯組件。
漢王自動問答系統,使用自然語言處理相關的詞法句法語義分析、信息檢索、知識工程、文本生成等多項技術,給定一篇原文和問題,可以自動找到答案??蓱糜谥悄軉柎?、智能檢索、機器閱讀理解、自動文章摘要等業務場景。