-
公开(公告)号:CN111611776A
公开(公告)日:2020-09-01
申请号:CN202010442133.X
申请日:2020-05-22
Applicant: 北京信息科技大学 , 北京新云胜科技有限公司 , 中国电子技术标准化研究院 , 北京安信天元科技发展有限公司 , 百望股份有限公司 , 北京方正阿帕比技术有限公司 , 北京大学 , 北京数科网维技术有限责任公司 , 福建福昕软件开发股份有限公司 , 福昕鲲鹏(北京)信息科技有限公司 , 方正国际软件(北京)有限公司
IPC: G06F40/149 , G06F40/186
Abstract: 本公开的实施例公开了兼容版流文档内容并支持同步阅读的方法和装置。该方法的一具体实施方式包括:获取用户针对目标文档的阅读方式信息,其中,目标文档包括文档正文和附加信息,附加信息存储在附加信息区域中;将目标文档存储为版流一体的文档记录结构;版流一体的文档记录结构保存版式文档、流式格式内容框架、关联记录和附加信息;根据阅读方式信息,解析并显示目标文档;响应于用户更新附加信息,更新并存储附加信息区域中的附加信息。这种方法实现了满足不同阅读方式要求的文档处理方法,同时提供了支持该文档处理方法的同步阅读装置,提供给用户良好的阅读体验。文档处理完毕后,文档正文无变化,仅更新附加信息,节省存储空间。
-
公开(公告)号:CN113703699B
公开(公告)日:2023-05-05
申请号:CN202111185218.5
申请日:2021-10-12
IPC: G06F3/12
Abstract: 本公开的实施例公开了电子文件的实时输出方法和装置。该方法的一具体实施方式包括:获取打印参数集合和目标电子文件,其中,打印参数集合为目标电子文件对应的打印相关限定参数集合;从打印参数中解析出打印对象集合;从目标电子文件中解析出页面数据集合;根据打印对象集合和页面数据集合实时打印输出目标电子文件。该实施方式能够同步展示电子文件中的动态内容变化情况,实现电子文档的可视化预览排版,同时实时打印电子文件中的动态内容,提高电子文件输出效率,减少了电子文件输出的资源消耗。
-
公开(公告)号:CN111125439A
公开(公告)日:2020-05-08
申请号:CN201911241767.2
申请日:2019-12-06
IPC: G06F16/81
Abstract: 本发明公开了一种XML数据处理方法、系统和存储介质,该方法包括:在读入XML数据过程中将XML数据中的每个XML元素节点绑定一个节点标识,其中,节点标识是整数编码值;将节点标识与预设列表相关联,其中,预设列表包括节点标识的名称表、节点标识的子节点标识列表、节点标识的节点文本列表和节点标识的属性列表;根据节点标识和预设列表构建以节点标识及其兄弟节点的索引值为参数入口的XML数据处理接口集;根据XML数据处理接口集封装用户的相关操作,其中,相关操作至少包括定位元素节点、添加元素节点、删除元素节点、给元素节点赋值和/或导出保存XML数据。通过本发明解决了现有技术缺陷造成的处理效率低下的问题。
-
公开(公告)号:CN110705503A
公开(公告)日:2020-01-17
申请号:CN201910973998.6
申请日:2019-10-14
Applicant: 北京信息科技大学
IPC: G06K9/00 , G06F16/901 , G06F40/189
Abstract: 本公开的实施例公开了生成目录结构化信息的方法和装置。该方法的一具体实施方式包括:获取待处理版式文档,待处理版式文档包括目录;基于目录的目录特征信息,对目录进行识别,得到版式目录信息;对版式目录信息依次进行去噪、分栏、成行分段、去重处理,得到处理后的版式目录信息;将处理后的版式目录信息映射为目录结构化信息。该实施方式增强了目录在不同设备上显示的自适应性。
-
公开(公告)号:CN110705503B
公开(公告)日:2022-02-25
申请号:CN201910973998.6
申请日:2019-10-14
Applicant: 北京信息科技大学
IPC: G06V30/413 , G06F16/901 , G06F40/189
-
公开(公告)号:CN111046096A
公开(公告)日:2020-04-21
申请号:CN201911296540.8
申请日:2019-12-16
IPC: G06F16/25 , G06F40/189
Abstract: 本公开的实施例公开了用于生成图文结构化信息的方法和装置。该方法的一具体实施方式包括:对待处理的图文混排的版式文档的段落进行识别,得到段落信息,其中,上述段落信息包括用于表征上述段落所在范围的段落外接边框信息;根据上述段落外接边框信息,确定上述段落内的版式图文要素信息;对上述版式图文要素信息进行图元类别信息读取、判定并标记,得到版式图文信息;根据预设的上述版式图文信息的阅读顺序,进行分析、拆分、重排图元对象,得到图文信息;将上述图文信息映射成图文结构化信息。该实施方式实现了图文结构化信息准确生成,进而增强了文档在不同设备上显示的自适应性。
-
公开(公告)号:CN111046096B
公开(公告)日:2023-11-24
申请号:CN201911296540.8
申请日:2019-12-16
IPC: G06F16/25 , G06F40/189
Abstract: 本公开的实施例公开了用于生成图文结构化信息的方法和装置。该方法的一具体实施方式包括:对待处理的图文混排的版式文档的段落进行识别,得到段落信息,其中,上述段落信息包括用于表征上述段落所在范围的段落外接边框信息;根据上述段落外接边框信息,确定上述段落内的版式图文要素信息;对上述版式图文要素信息进行图元类别信息读取、判定并标记,得到版式图文信息;根据预设的上述版式图文信息的阅读顺序,进行分析、拆分、重排图元对象,得到图文信息;将上述图文信息映射成图文结构化信息。该实施方式实现了图文结构化信息准确生成,进而增强了文档在不同设备上显示的自适应性。
-
公开(公告)号:CN111611776B
公开(公告)日:2023-07-25
申请号:CN202010442133.X
申请日:2020-05-22
Applicant: 北京信息科技大学 , 北京新云胜科技有限公司 , 中国电子技术标准化研究院 , 北京安信天元科技发展有限公司 , 百望股份有限公司 , 北京方正阿帕比技术有限公司 , 北京大学 , 北京数科网维技术有限责任公司 , 福建福昕软件开发股份有限公司 , 福昕鲲鹏(北京)信息科技有限公司 , 方正国际软件(北京)有限公司
IPC: G06F40/149 , G06F40/186
Abstract: 本公开的实施例公开了兼容版流文档内容并支持同步阅读的方法和装置。该方法的一具体实施方式包括:获取用户针对目标文档的阅读方式信息,其中,目标文档包括文档正文和附加信息,附加信息存储在附加信息区域中;将目标文档存储为版流一体的文档记录结构;版流一体的文档记录结构保存版式文档、流式格式内容框架、关联记录和附加信息;根据阅读方式信息,解析并显示目标文档;响应于用户更新附加信息,更新并存储附加信息区域中的附加信息。这种方法实现了满足不同阅读方式要求的文档处理方法,同时提供了支持该文档处理方法的同步阅读装置,提供给用户良好的阅读体验。文档处理完毕后,文档正文无变化,仅更新附加信息,节省存储空间。
-
公开(公告)号:CN113703699A
公开(公告)日:2021-11-26
申请号:CN202111185218.5
申请日:2021-10-12
IPC: G06F3/12
Abstract: 本公开的实施例公开了电子文件的实时输出方法和装置。该方法的一具体实施方式包括:获取打印参数集合和目标电子文件,其中,打印参数集合为目标电子文件对应的打印相关限定参数集合;从打印参数中解析出打印对象集合;从目标电子文件中解析出页面数据集合;根据打印对象集合和页面数据集合实时打印输出目标电子文件。该实施方式能够同步展示电子文件中的动态内容变化情况,实现电子文档的可视化预览排版,同时实时打印电子文件中的动态内容,提高电子文件输出效率,减少了电子文件输出的资源消耗。
-
-
-
-
-
-
-
-