-
公开(公告)号:CN110795561B
公开(公告)日:2021-04-02
申请号:CN201911015179.7
申请日:2019-10-24
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/35 , G06F40/205 , G06F40/289 , G06F40/232 , G06K9/62
Abstract: 本发明提供一种电子卷宗材料类型自动识别系统及其自主学习方法,在电子卷宗自动识别系统进行材料自动分类编目时,当出现一些新的电子卷宗材料未被识别出类型,或者材料类型识别错误的情况,用户会手动修改系统标识出的当前材料的标签名称,进行重命名,系统会根据用户的修改记录行为,自动学习并生成新增材料类型的逻辑规则,同时自主提取出材料的标题,通过标题与客户修改后的标签名称的短文本相似比较,判断客户录入的标签名称是否和标题存在强关联性,确保正确的标签名称匹配规则。本发明能根据用户的操作记录主动学习,提升识别准确性,实现了对新材料类型实时支持,同时降低了开发、运维人员的学习成本和沟通成本,提高了运维效率。
-
公开(公告)号:CN110826619A
公开(公告)日:2020-02-21
申请号:CN201911058977.8
申请日:2019-11-01
Applicant: 北京华宇信息技术有限公司
Abstract: 本公开实施例中提供了一种电子卷宗的文件分类方法、装置及电子设备,属于图像处理技术领域,该方法包括:接收待分类的电子卷宗的全部材料页对应的图像;对每个材料页的图像进行预处理,得到每个材料页对应图像的版面类型,其中,所述版面类型包括首页、中间页和尾页;对所述电子卷宗的全部首页图像进行文字识别;依据所述电子卷宗对应的全部首页图像的文字识别结果进行预设规则的文件类别匹配,得到每个首页图像对应文件的文件类别。通过本公开的处理方案,提高了电子卷宗的文件分类的效率和计算资源的利用率。
-
公开(公告)号:CN110795561A
公开(公告)日:2020-02-14
申请号:CN201911015179.7
申请日:2019-10-24
Applicant: 北京华宇信息技术有限公司
IPC: G06F16/35 , G06F40/205 , G06F40/289 , G06F40/232 , G06K9/62
Abstract: 本发明提供一种电子卷宗材料类型自动识别系统及其自主学习方法,在电子卷宗自动识别系统进行材料自动分类编目时,当出现一些新的电子卷宗材料未被识别出类型,或者材料类型识别错误的情况,用户会手动修改系统标识出的当前材料的标签名称,进行重命名,系统会根据用户的修改记录行为,自动学习并生成新增材料类型的逻辑规则,同时自主提取出材料的标题,通过标题与客户修改后的标签名称的短文本相似比较,判断客户录入的标签名称是否和标题存在强关联性,确保正确的标签名称匹配规则。本发明能根据用户的操作记录主动学习,提升识别准确性,实现了对新材料类型实时支持,同时降低了开发、运维人员的学习成本和沟通成本,提高了运维效率。
-
-