文档中的阅读顺序检测
    1.
    发明公开

    公开(公告)号:CN115545036A

    公开(公告)日:2022-12-30

    申请号:CN202110739466.3

    申请日:2021-06-30

    Abstract: 根据本公开的实现,提出了一种用于文档中的阅读顺序检测的方案。在该方案中,确定文档中呈现的文本序列和布局信息,文本序列包括多个文本单元,布局信息指示多个文本单元在文档中的空间布局;至少基于文本序列和布局信息来生成多个文本单元对应的多个语义特征表示;以及基于多个语义特征表示来确定多个文本单元在文档中的阅读顺序。根据该方案,布局信息的引入能够更好地表征文本单元在特定文档下的空间布局方式,从而能够更有效、准确地确定阅读顺序。

Patent Agency Ranking