基于视觉和文本特征的通用表格信息检索的方法与系统

    公开(公告)号:CN112100426B

    公开(公告)日:2024-05-24

    申请号:CN202011004577.1

    申请日:2020-09-22

    Abstract: 本发明所提供的基于视觉和文本特征的通用表格信息检索的方法与系统,该方法包括输入格式标准化、表格内容索引、基本内容单元的向量化表示、查询的向量化表示、融合视觉特征的表格信息检索、内容单元合并、答案筛选并返回。基于本发明所述通用表格信息检索方法与系统可以用于以电子文档、网页、PDF和图片等多种格式出现的表格,本发明在现有基于文本特征的表格问答系统的基础上,联合表格的视觉特征,如表格的框线、基本内容单元的坐标、文本的字体、颜色和缩进等,自动根据所提问题对存在丰富视觉信息的非规范化表格进行信息检索,极大提升了对文档的检索能力,且提高了检索结果的精确度。

    基于视觉和文本特征的通用表格信息检索的方法与系统

    公开(公告)号:CN112100426A

    公开(公告)日:2020-12-18

    申请号:CN202011004577.1

    申请日:2020-09-22

    Abstract: 本发明所提供的基于视觉和文本特征的通用表格信息检索的方法与系统,该方法包括输入格式标准化、表格内容索引、基本内容单元的向量化表示、查询的向量化表示、融合视觉特征的表格信息检索、内容单元合并、答案筛选并返回。基于本发明所述通用表格信息检索方法与系统可以用于以电子文档、网页、PDF和图片等多种格式出现的表格,本发明在现有基于文本特征的表格问答系统的基础上,联合表格的视觉特征,如表格的框线、基本内容单元的坐标、文本的字体、颜色和缩进等,自动根据所提问题对存在丰富视觉信息的非规范化表格进行信息检索,极大提升了对文档的检索能力,且提高了检索结果的精确度。

Patent Agency Ranking