电子卷宗的文件分类方法、装置及电子设备

    公开(公告)号:CN110826619A

    公开(公告)日:2020-02-21

    申请号:CN201911058977.8

    申请日:2019-11-01

    Abstract: 本公开实施例中提供了一种电子卷宗的文件分类方法、装置及电子设备,属于图像处理技术领域,该方法包括:接收待分类的电子卷宗的全部材料页对应的图像;对每个材料页的图像进行预处理,得到每个材料页对应图像的版面类型,其中,所述版面类型包括首页、中间页和尾页;对所述电子卷宗的全部首页图像进行文字识别;依据所述电子卷宗对应的全部首页图像的文字识别结果进行预设规则的文件类别匹配,得到每个首页图像对应文件的文件类别。通过本公开的处理方案,提高了电子卷宗的文件分类的效率和计算资源的利用率。

    一种电子卷宗材料类型自动识别系统及其自主学习方法

    公开(公告)号:CN110795561A

    公开(公告)日:2020-02-14

    申请号:CN201911015179.7

    申请日:2019-10-24

    Abstract: 本发明提供一种电子卷宗材料类型自动识别系统及其自主学习方法,在电子卷宗自动识别系统进行材料自动分类编目时,当出现一些新的电子卷宗材料未被识别出类型,或者材料类型识别错误的情况,用户会手动修改系统标识出的当前材料的标签名称,进行重命名,系统会根据用户的修改记录行为,自动学习并生成新增材料类型的逻辑规则,同时自主提取出材料的标题,通过标题与客户修改后的标签名称的短文本相似比较,判断客户录入的标签名称是否和标题存在强关联性,确保正确的标签名称匹配规则。本发明能根据用户的操作记录主动学习,提升识别准确性,实现了对新材料类型实时支持,同时降低了开发、运维人员的学习成本和沟通成本,提高了运维效率。

    一种对电子卷宗的标题自动识别的方法及装置

    公开(公告)号:CN110728240A

    公开(公告)日:2020-01-24

    申请号:CN201910972986.1

    申请日:2019-10-14

    Abstract: 本发明提供了一种对电子卷宗的标题自动识别的方法及装置,对所述电子卷宗分类,分为文本格式卷宗和表格格式卷宗;分别对文本格式卷宗和表格格式卷宗进行标题识别,输出标题识别结果。对于表格类卷宗,通过表格区域识别,可以识别表头文本区域,并提取表头文本,按行做标题判断,提升表格格式卷宗的标题识别准确性。本发明的标题判断模型采用深度神经网络的方式进行训练,分别对标题和非标题的文本进行标注训练,使得此模型的适用性更强,匹配的结果更为精确。

    形似字库生成方法及系统
    4.
    发明公开

    公开(公告)号:CN117252192A

    公开(公告)日:2023-12-19

    申请号:CN202311303903.2

    申请日:2023-10-09

    Abstract: 本申请公开了一种形似字库生成方法及系统,用以解决低质量样本字单元构成的形似字库导致文字校对系统识别效率较低的技术问题。其中,一种形似字库生成方案,通过从表意文字描述序列、笔画序列两个筛选维度确定目标字单元的形近字单元,相互补充各筛选维度遗漏的形近字单元,得到较为全面的综合形近字集合。之后对综合形近字集合内若干形近字单元分别以四角号码序列、字频两个评价维度,进一步筛选出容易出现输入错误的形近字单元,构成形似字库。这样的形似字库体量适中、质量较高,适用于日常的文字校对,能够提高文字校对系统的识别效率和校对性能。

    文本校正方法、装置、系统及计算机存储介质

    公开(公告)号:CN117252191A

    公开(公告)日:2023-12-19

    申请号:CN202311303805.9

    申请日:2023-10-09

    Abstract: 本申请公开了一种文本校正方法、装置、系统及计算机存储介质,用以解决校正推荐文本的准确度较低的技术问题。其中,一种文本校正方案,包括以下步骤:获取待校正文本;确定待校正文本中的疑错文本;根据输入法词库、音形相似字库,确定对应疑错文本的校正推荐文本。所述文本校正方案基于疑错文本,在音形相似字库中匹配相似词汇,能够得到较为丰富的校正推荐候选词汇,不受复杂语义分析的干扰。基于相似词汇,进一步结合输入法词库,从而以周期性的输入习惯维度确定校正推荐文本,能够应对语言实体的迭代周期,进而提高了校正推荐文本的准确度。

    一种切换不同输入法界面的方法和装置

    公开(公告)号:CN110825484B

    公开(公告)日:2021-12-07

    申请号:CN201911100416.X

    申请日:2019-11-12

    Inventor: 赵国华 米坤 付阳

    Abstract: 本发明提供一种切换不同输入法界面的方法和装置,输入法按照kimpanel接口,实现一套与其对应的个性化输入法界面。实际使用中,当用户调用该输入法时,框架发现接口有实现的时候,会把绘制等消息发到新实现的接口中,显示与该输入法对应的输入法界面。当切换成其他输入法的时候,输入法界面断开与框架的连接,并且恢复成默认的输入法界面。本发明提供了输入法的个性界面,并且能实现不同输入法的界面的动态切换,提高了为用户服务的质量。

    一种电子卷宗材料类型自动识别系统及其自主学习方法

    公开(公告)号:CN110795561B

    公开(公告)日:2021-04-02

    申请号:CN201911015179.7

    申请日:2019-10-24

    Abstract: 本发明提供一种电子卷宗材料类型自动识别系统及其自主学习方法,在电子卷宗自动识别系统进行材料自动分类编目时,当出现一些新的电子卷宗材料未被识别出类型,或者材料类型识别错误的情况,用户会手动修改系统标识出的当前材料的标签名称,进行重命名,系统会根据用户的修改记录行为,自动学习并生成新增材料类型的逻辑规则,同时自主提取出材料的标题,通过标题与客户修改后的标签名称的短文本相似比较,判断客户录入的标签名称是否和标题存在强关联性,确保正确的标签名称匹配规则。本发明能根据用户的操作记录主动学习,提升识别准确性,实现了对新材料类型实时支持,同时降低了开发、运维人员的学习成本和沟通成本,提高了运维效率。

Patent Agency Ranking