电子文档归档方法及其装置

    公开(公告)号:CN112733658B

    公开(公告)日:2022-11-25

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    电子文档归档方法及其装置

    公开(公告)号:CN112733658A

    公开(公告)日:2021-04-30

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    手绘流程图标准化生成方法及其装置

    公开(公告)号:CN112711362A

    公开(公告)日:2021-04-27

    申请号:CN202011546888.0

    申请日:2020-12-24

    Abstract: 本申请公开了一种手绘流程图标准化生成方法及其装置。其中方法包括:获取用户绘制记录数据;将用户绘制记录数据输入至意图判断模型,判断用户绘制意图类型;根据用户绘制意图类型判断结果,识别用户绘制信息;根据用户绘制信息识别结果,生成标准化流程图;其中,所述用户绘制记录数据包括用户绘制的起笔时间和坐标、路径信息、落笔时间和坐标至少其中一种,所述用户绘制意图类型包括图形绘制意图、文字绘制意图至少其中一种;所述用户绘制信息识别结果包括图形信息和文字信息至少其中一种。通过本申请的手绘流程图标准化生成方法,可以直接将用户手绘的流程草图生成标准化的流程框图,有效提高工作效率和用户体验。

    一种OFD文档网页端浏览的方法及系统

    公开(公告)号:CN110765385B

    公开(公告)日:2021-03-26

    申请号:CN201911018601.4

    申请日:2019-10-24

    Abstract: 本发明提供一种OFD文档网页端浏览的方法及系统,浏览器将OFD文档标识传给服务器,服务器返回OFD文档的页结构信息给浏览器;浏览器根据接收的信息对OFD文档进行分组,生成所有分组的HTML标签,并生成当前分组下包含页的HTML标签。当前页为第n页,浏览器在浏览器缓存中查询第n‑1、n、n+1、n+2页是否已经加载,如果已经加载,则不做处理,如果没有加载,则向服务器请求加载相应页面数据。本发明采用异步加载的方式,按需加载,减少了浏览器端的等待时间,简化HTML文档结构,可以降低浏览器的渲染压力,提高浏览器的响应速度。

    手写输入文本定位方法及装置

    公开(公告)号:CN112527128A

    公开(公告)日:2021-03-19

    申请号:CN202011543403.2

    申请日:2020-12-23

    Abstract: 本申请公开了一种手写输入文本定位方法及装置,从而提供了一种无需手动激活文本框便可直接完成文本录入的实现方式。其中,手写输入文本定位方法,包括以下步骤:获取手写框中的书写文本;确定手写框的覆盖范围和文本框范围;比较所述手写框覆盖范围与文本框范围,确定与所述手写框覆盖范围对应的文本框;输入所述书写文本到所述对应的文本框。手写输入文本定位装置包括:获取模块,用于获取手写框中的书写文本;识别模块,用于确定手写框覆盖范围、文本框范围;比较模块,用于比较所述手写框覆盖范围与文本框范围,确定与所述手写框覆盖范围对应的文本框;输入模块,用于将所述书写文本输入到所述对应的文本框。

    电子卷宗的文件分类方法、装置及电子设备

    公开(公告)号:CN110826619A

    公开(公告)日:2020-02-21

    申请号:CN201911058977.8

    申请日:2019-11-01

    Abstract: 本公开实施例中提供了一种电子卷宗的文件分类方法、装置及电子设备,属于图像处理技术领域,该方法包括:接收待分类的电子卷宗的全部材料页对应的图像;对每个材料页的图像进行预处理,得到每个材料页对应图像的版面类型,其中,所述版面类型包括首页、中间页和尾页;对所述电子卷宗的全部首页图像进行文字识别;依据所述电子卷宗对应的全部首页图像的文字识别结果进行预设规则的文件类别匹配,得到每个首页图像对应文件的文件类别。通过本公开的处理方案,提高了电子卷宗的文件分类的效率和计算资源的利用率。

    一种电子卷宗材料类型自动识别系统及其自主学习方法

    公开(公告)号:CN110795561A

    公开(公告)日:2020-02-14

    申请号:CN201911015179.7

    申请日:2019-10-24

    Abstract: 本发明提供一种电子卷宗材料类型自动识别系统及其自主学习方法,在电子卷宗自动识别系统进行材料自动分类编目时,当出现一些新的电子卷宗材料未被识别出类型,或者材料类型识别错误的情况,用户会手动修改系统标识出的当前材料的标签名称,进行重命名,系统会根据用户的修改记录行为,自动学习并生成新增材料类型的逻辑规则,同时自主提取出材料的标题,通过标题与客户修改后的标签名称的短文本相似比较,判断客户录入的标签名称是否和标题存在强关联性,确保正确的标签名称匹配规则。本发明能根据用户的操作记录主动学习,提升识别准确性,实现了对新材料类型实时支持,同时降低了开发、运维人员的学习成本和沟通成本,提高了运维效率。

    一种OFD文档在线浏览方法
    18.
    发明授权

    公开(公告)号:CN112800366B

    公开(公告)日:2024-12-27

    申请号:CN202011629226.X

    申请日:2020-12-31

    Abstract: 本申请公开了一种OFD文档在线浏览方法,包括:解析待浏览OFD文档,获得OFD文档第一元素、与第一元素不同的第二元素的索引信息;根据所述索引信息,以第一用户界面展示所述第一元素;接收用户针对第二元素的浏览指令;根据用户的浏览指令和所述索引信息,以第二用户界面展示第二元素。本申请实施例的文档浏览方法,文档结构明显减少,当在线浏览OFD文档时,预览区域主要是分组HTML DIV,页HTML DIV。文字信息暂存在内存中,选中的时候才会生成相应的DIV标签,从而避免大量html元素的生成和重绘,进一步节约系统资源,提高浏览效率。

    文本校正方法、装置、系统及计算机存储介质

    公开(公告)号:CN117252191A

    公开(公告)日:2023-12-19

    申请号:CN202311303805.9

    申请日:2023-10-09

    Abstract: 本申请公开了一种文本校正方法、装置、系统及计算机存储介质,用以解决校正推荐文本的准确度较低的技术问题。其中,一种文本校正方案,包括以下步骤:获取待校正文本;确定待校正文本中的疑错文本;根据输入法词库、音形相似字库,确定对应疑错文本的校正推荐文本。所述文本校正方案基于疑错文本,在音形相似字库中匹配相似词汇,能够得到较为丰富的校正推荐候选词汇,不受复杂语义分析的干扰。基于相似词汇,进一步结合输入法词库,从而以周期性的输入习惯维度确定校正推荐文本,能够应对语言实体的迭代周期,进而提高了校正推荐文本的准确度。

    带情绪描述的笔录文档处理方法及装置

    公开(公告)号:CN116844551A

    公开(公告)日:2023-10-03

    申请号:CN202310071797.3

    申请日:2023-01-13

    Abstract: 本申请公开了一种带情绪描述的笔录文档处理方法即装置,用以解决现有技术判断效率低的技术问题。该方法包括:获取用于表征参与制作笔录的人物声纹特征;采集制作笔录现场的音频文件;对音频文件进行转换文字的语音转写、人物情绪识别、人物声纹特征识别,以建立人物声纹特征与文字的对应关系、建立人物声纹特征与人物情绪的对应关系;根据人物声纹特征和音频特征,制作带人物情绪描述的文字型笔录。对音频文件进行语音转写、人物情绪识别、人物声纹特征识别,将转写、识别结果建立对应关系,并生成文字型笔录。这样,在后续翻看笔录的时不必重复的查看当时的语音视频记录,就可以还原当事人的情绪状态,进行研判,提高了审判员的判断效率。

Patent Agency Ranking