-
公开(公告)号:CN107423271A
公开(公告)日:2017-12-01
申请号:CN201710647290.2
申请日:2017-08-01
Applicant: 北京信息科技大学
IPC: G06F17/22
Abstract: 本申请实施例公开了文档生成方法和装置。该方法的一具体实施方式包括:获取包括至少两个文档组成单元的初始流式文档,确定指示每一个文档组成单元的用于标注的元数据;根据所确定的元数据的语义,将所确定的元数据进行基于可扩展置标语言的结构化处理,生成标记有标记信息的可扩展置标语言架构文档;获取带有注释性标记的初始流式文档,将带有注释性标记的初始流式文档确定为注释性流式文档;建立可扩展置标语言架构文档中标记的标记信息和该注释性流式文档所标记的标记信息的映射关系;基于该映射关系,将该注释性流式文档转换为可扩展置标语言文档。生成了标注有标注信息的可扩展置标语言文档,便于计算机更加深入地理解文档。
-
公开(公告)号:CN107423271B
公开(公告)日:2020-08-21
申请号:CN201710647290.2
申请日:2017-08-01
Applicant: 北京信息科技大学
IPC: G06F40/151 , G06F40/143
Abstract: 本申请实施例公开了文档生成方法和装置。该方法的一具体实施方式包括:获取包括至少两个文档组成单元的初始流式文档,确定指示每一个文档组成单元的用于标注的元数据;根据所确定的元数据的语义,将所确定的元数据进行基于可扩展置标语言的结构化处理,生成标记有标记信息的可扩展置标语言架构文档;获取带有注释性标记的初始流式文档,将带有注释性标记的初始流式文档确定为注释性流式文档;建立可扩展置标语言架构文档中标记的标记信息和该注释性流式文档所标记的标记信息的映射关系;基于该映射关系,将该注释性流式文档转换为可扩展置标语言文档。生成了标注有标注信息的可扩展置标语言文档,便于计算机更加深入地理解文档。
-