Core Technology
KAIYUN体育要素抽取引擎,基于深度学习和自然语言处理技术,可适用于一切需要从非结构化数据(普通文档)中进行结构化数据抽取的业务场景,包括:卡证、名片、发票、凭证、财务报表、合同、论文、登记表格等,抽取的要素包括但不限于:人名、地址、时间、机构、金额、编号、标题、关键词、数字,可处理的文档格式包括:Txt、Word、Excel、PDF、图像文件等。
KAIYUN体育基于深度学习的知识图谱建设和管理系统,可从非结构化数据中抽取知识,包括人名、机构、职位、事件、时间、地点等实体,包括人物籍贯、人物生卒日期等属性,包括人物亲属关系、人物担任职位、职位从属机构、人物参与历史事件等关系,构建知识图谱、知识挖掘、知识推理、知识问答。已应用于档案和文教行业,业务场景包括民国历史人物图谱、人事档案履历图谱、机构设立迁址图谱等。
KAIYUN体育机器翻译平台,使用基于深度学习的自然语言处理技术,已实现将自然语言翻译为结构化查询语言(Structured Query Language,简称SQL)的功能,可扩展为其它语种之间的翻译平台,例如中文翻译为英文、英文翻译为中文等。KAIYUN体育机器翻译平台,支持知识图谱查询、应用系统查询、结构化数据查询,为自动问答提供语言翻译组件。
KAIYUN体育自动问答系统,使用自然语言处理相关的词法句法语义分析、信息检索、知识工程、文本生成等多项技术,给定一篇原文和问题,可以自动找到答案。可应用于智能问答、智能检索、机器阅读理解、自动文章摘要等业务场景。