Main Business
本产品通过全新的技术手段,从卷宗电子化的数据源头实现卷宗的全样本精准识别、自动分类、关键信息提取、自动编目,满足卷宗电子阅卷、文书制作、类案推送、自动编目等深度应用的数据应用需求及数据真实需求,进而提高人民法院审判工作效率及司法公信度。
本产品对卷宗材料中对识别有影响的干扰因素进行自适应规避,识别引擎需能够自适应的干扰因素包括但不限于:证件复印件底纹、证件复印件底灰、文字划线、表格线、文字上方扣章、版面污损、版面噪声、文本扭曲等。识别时可将此部分干扰项去除,对干扰项下的文字进行有效识别,保证电子卷宗内容的完整性及可用性。
利用与高速扫描仪及高清拍照仪的硬件对接,实现对纸质卷宗的影像采集功能,平台将卷宗扫描及卷宗拍照两种加工模式进行融合,使操作人员在卷宗加工过程中无需切换,提高卷宗加工整体性及加工效率,相比传统加工模式效率提高40%以上。
本产品通过对海量手写材料训练分析,能够根据手写文字特征输出对应识别结果,并综合字符分类的置信度、语言上下文、几何上下文等各方面的信息输出最佳识别结果,识别准确率可达95%以上。
本产品采用能够对文本类型进行区分,可根据不同文本类型采用不同识别技术进行识别,并将识别结果进行拼接,保证混合材料的识别结果整体性及有效性。
本产品通过采用表格分析方法分析表格的逻辑结果,对表格中存在的文字进行识别,最后得到对识别结果做后处理,保证识别结果不受表格线等干扰项影响,保证识别准确率。
本产品能够基于深度学习技术,利用光学字符识别技术实现多种卡证的识别,无需提前告知卡证的类别,即可进行高效准确的识别,适用于多种卡证同时识别的需求,包括:身份证、银行卡、驾照、行驶证、名片、火车票、出租车票、营业执照、邮政EMS快递单、律师证、户籍证、房产证、组织机构代码、国税地税增值税发票等。
本产品能够对卷宗中存在的非文本内容进行提取,如公章(方章、圆章、异形章)、指印、签字等,引擎能够对文本内容及非文本内容进行正确区分,保证卷宗中非文本内容的精确检测。