对流格式文档中的布局结构元素进行色彩编码

    公开(公告)号:CN104471588B

    公开(公告)日:2018-11-20

    申请号:CN201280074809.8

    申请日:2012-07-20

    Abstract: 提供了色彩编码引擎和比较引擎。色彩编码引擎可被利用来检测流格式文档中的逻辑布局对象属性,并将唯一性的色彩应用于与每一逻辑布局对象属性相关联的文本元素。得到的经色彩编码的文档可被保存为目标流格式文档。目标流格式文档可被转换成固定格式文档,并随后被转换引擎转换成流格式文档。得到的经转换流格式文档可被保存为输出流格式文档。比较引擎可被利用来将输出流格式文档和目标流格式文档进行比较以确定布局信息是否已在文档转换过程中被正确地保留。

    检测并重构固定格式文档中的从右到左文本方向、连字和变音符号

    公开(公告)号:CN105144147A

    公开(公告)日:2015-12-09

    申请号:CN201480014083.8

    申请日:2014-02-28

    CPC classification number: G06F17/275 G06F17/2223 G06F17/2247

    Abstract: 提供了对固定格式文档中的从右到左的文本方向、从左到右的文本方向、连字和变音符的检测,以用于将固定格式文档重构成流格式文档。固定格式文档的每一文本串被分析以得到方向性。如果文本串包含连字,则将这些连字映射到相应的字符,以在包括其中放置有这些连字的文本串或与这些连字相邻的文本串的其他字符的上下文中实现这些连字的合适阅读次序。每一文本串都是基于确定的文本方向性来收集的,以供重构在流格式文档中。文本的列的合适文本方向性是按与文本的段落中的文本串的合适文本方向性相同的方式来确定的。如果存在与一个或多个字符或符号相关联的变音符号,则可作出关于与每一变音符号相关联的载体字符或符号的确定。

Patent Agency Ranking