版式文档浏览方法及系统

    公开(公告)号:CN116186438B

    公开(公告)日:2023-09-05

    申请号:CN202310071850.X

    申请日:2023-01-13

    Abstract: 本申请公开了一种版式文档浏览方法及系统,用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。其中,一种版式文档浏览方案,通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限,提供匹配的多个版式文档,以便不同浏览权限的浏览对象进行浏览,提高了访问的安全性。通过对版式文档进行分组加载,提高了加载效率。

    版式文档浏览方法及系统

    公开(公告)号:CN116186438A

    公开(公告)日:2023-05-30

    申请号:CN202310071850.X

    申请日:2023-01-13

    Abstract: 本申请公开了一种版式文档浏览方法及系统,用以解决连续浏览多个版式文档对存储资源造成浪费的技术问题。其中,一种版式文档浏览方案,通过在线加载多个版式文档以减轻存储资源造成的浪费。通过根据浏览对象的浏览权限,提供匹配的多个版式文档,以便不同浏览权限的浏览对象进行浏览,提高了访问的安全性。通过对版式文档进行分组加载,提高了加载效率。

    电子文档归档方法及其装置

    公开(公告)号:CN112733658B

    公开(公告)日:2022-11-25

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    电子文档归档方法及其装置

    公开(公告)号:CN112733658A

    公开(公告)日:2021-04-30

    申请号:CN202011619714.2

    申请日:2020-12-31

    Abstract: 本申请公开了一种电子文档归档方法及其装置。其中方法包括:接收待归档的电子文档;采用图像分割算法分析待归档的电子文档,获取版面结构信息;根据版面结构信息,对待归档电子文档进行归档。通过本申请的电子文档归档方法,采用图像分割算法对待归档电子文档的版面进行分析,根据版面结构,对具有关键信息的区域再进行OCR识别,从而实现对电子文档的分类与归目。本申请的电子文档归档方法避免了大量OCR识别导致的资源占用和数据冗余,进一步提高电子文档归档的精度和效率。

    手绘流程图标准化生成方法及其装置

    公开(公告)号:CN112711362A

    公开(公告)日:2021-04-27

    申请号:CN202011546888.0

    申请日:2020-12-24

    Abstract: 本申请公开了一种手绘流程图标准化生成方法及其装置。其中方法包括:获取用户绘制记录数据;将用户绘制记录数据输入至意图判断模型,判断用户绘制意图类型;根据用户绘制意图类型判断结果,识别用户绘制信息;根据用户绘制信息识别结果,生成标准化流程图;其中,所述用户绘制记录数据包括用户绘制的起笔时间和坐标、路径信息、落笔时间和坐标至少其中一种,所述用户绘制意图类型包括图形绘制意图、文字绘制意图至少其中一种;所述用户绘制信息识别结果包括图形信息和文字信息至少其中一种。通过本申请的手绘流程图标准化生成方法,可以直接将用户手绘的流程草图生成标准化的流程框图,有效提高工作效率和用户体验。

    一种OFD文档网页端浏览的方法及系统

    公开(公告)号:CN110765385B

    公开(公告)日:2021-03-26

    申请号:CN201911018601.4

    申请日:2019-10-24

    Abstract: 本发明提供一种OFD文档网页端浏览的方法及系统,浏览器将OFD文档标识传给服务器,服务器返回OFD文档的页结构信息给浏览器;浏览器根据接收的信息对OFD文档进行分组,生成所有分组的HTML标签,并生成当前分组下包含页的HTML标签。当前页为第n页,浏览器在浏览器缓存中查询第n‑1、n、n+1、n+2页是否已经加载,如果已经加载,则不做处理,如果没有加载,则向服务器请求加载相应页面数据。本发明采用异步加载的方式,按需加载,减少了浏览器端的等待时间,简化HTML文档结构,可以降低浏览器的渲染压力,提高浏览器的响应速度。

    手写输入文本定位方法及装置

    公开(公告)号:CN112527128A

    公开(公告)日:2021-03-19

    申请号:CN202011543403.2

    申请日:2020-12-23

    Abstract: 本申请公开了一种手写输入文本定位方法及装置,从而提供了一种无需手动激活文本框便可直接完成文本录入的实现方式。其中,手写输入文本定位方法,包括以下步骤:获取手写框中的书写文本;确定手写框的覆盖范围和文本框范围;比较所述手写框覆盖范围与文本框范围,确定与所述手写框覆盖范围对应的文本框;输入所述书写文本到所述对应的文本框。手写输入文本定位装置包括:获取模块,用于获取手写框中的书写文本;识别模块,用于确定手写框覆盖范围、文本框范围;比较模块,用于比较所述手写框覆盖范围与文本框范围,确定与所述手写框覆盖范围对应的文本框;输入模块,用于将所述书写文本输入到所述对应的文本框。

    电子卷宗的文件分类方法、装置及电子设备

    公开(公告)号:CN110826619A

    公开(公告)日:2020-02-21

    申请号:CN201911058977.8

    申请日:2019-11-01

    Abstract: 本公开实施例中提供了一种电子卷宗的文件分类方法、装置及电子设备,属于图像处理技术领域,该方法包括:接收待分类的电子卷宗的全部材料页对应的图像;对每个材料页的图像进行预处理,得到每个材料页对应图像的版面类型,其中,所述版面类型包括首页、中间页和尾页;对所述电子卷宗的全部首页图像进行文字识别;依据所述电子卷宗对应的全部首页图像的文字识别结果进行预设规则的文件类别匹配,得到每个首页图像对应文件的文件类别。通过本公开的处理方案,提高了电子卷宗的文件分类的效率和计算资源的利用率。

    OFD版式文档段落识别方法及装置

    公开(公告)号:CN114359943B

    公开(公告)日:2024-12-20

    申请号:CN202210038042.9

    申请日:2022-01-13

    Abstract: 本申请公开了一种OFD版式文档段落识别方法及装置,用以解决版式文档提取文字段落错误率高的技术问题。其中,一种OFD版式文档段落识别方案,通过对所述版式图像进行图像分割,至少生成若干文字块;提取所述若干文字块的特征属性;将相似版式进行聚类,生成元素为文字块的若干聚类文字块集合;对所述若干聚类文字块集合进行段落识别,生成段落块信息;根据所述段落块信息,更新版式文档中的段落标识。以便操作者在对文本段落进行提取时,可以得到还原流式格式的字符串。并且通过对文字块的语义连续性进行计算,提高了识别文本段落的准确性。同时,还针对OFD版式文档表格提出了一种新的文本提取方案,提高了文本提取的泛用性。

    一种OFD文件在线解析与浏览的方法与装置

    公开(公告)号:CN110717127A

    公开(公告)日:2020-01-21

    申请号:CN201910972680.6

    申请日:2019-10-14

    Abstract: 本发明提供一种OFD文件在线解析与浏览的方法与装置,解析客户端指定页码的文件并生成标准的HTML和CSS,随后触发预生成服务,开始从该指定页之后逐页生成其他页码文件的HTML和CSS。客户端翻页后,如果服务端没有预生成对应的HTML和CSS文件,则生成翻页后的页面,继续从翻页的后页面开始重新触发预生成服务;如果服务端已经预生成了翻页页面对应的HTML和CSS文件,则直接利用预生成的文件进行前端显示。本发明无需全部解压OFD文件,通过预生成文件,提高翻页响应能力;本发明能直接生成文本格式,便于用户在网页上对文字进行选择或复制。

Patent Agency Ranking