一种开放领域问答的表格检索增强方法

    公开(公告)号:CN115563249A

    公开(公告)日:2023-01-03

    申请号:CN202211227233.6

    申请日:2022-10-09

    Abstract: 本发明属于自然语言处理和信息检索技术领域,提供一种基于执行引导的面向开放领域问答的表格检索增强方法。首先使用检索器从表格语料库中初步筛选相关的表格得到表格池,然后对于表格池中各表格,使用深度学习的Text‑to‑SQL模型,结合问句和表格模式信息将问句转换为SQL等的标准化的逻辑形式,接下来在表格上执行SQL并判断执行结果是否发生错误,以此作为相关性依据融入新一轮相似性计算中。本发明在表格检索的过程中充分利用到了表格的模式信息,将执行的结果融入了检索相似性得分,有效提高了开放域问答过程中表格检索阶段的准确率。

    一种基于TaPas模型和图注意力网络的表格问答处理方法

    公开(公告)号:CN115794871B

    公开(公告)日:2025-05-23

    申请号:CN202211563273.8

    申请日:2022-12-07

    Abstract: 本发明属于自然语言处理、表格问答技术领域,尤其是涉及一种基于TaPas模型和图注意力网络的表格问答处理方法。本发明提出使用图注意力神经网络来利用和融合TAPAS预训练模型提取的特征向量。在wikiSQL数据集上的实验结果表明,使用图注意力网络的TAPAS模型的准确度为87.0%,超过仅使用两个全连接层时TAPAS模型的准确度。同时,TAPAS模型对输入的表格问题对的文本长度是有限的,一般为512个符号,这就导致了TAPAS无法处理较大的表格。本发明提出了一种预处理表格的方法,通过提取表格中与问题有关的列,来缩小表格的大小,称这样的预处理操作为快照。在对表格做了快照之后,本发明的模型在WIkiSQL上的准确度上升至89.8%。

    一种基于prompt的表格事实检测方法

    公开(公告)号:CN115618004A

    公开(公告)日:2023-01-17

    申请号:CN202211402592.0

    申请日:2022-11-10

    Abstract: 本发明属于自然语言处理技术领域,尤其是涉及一种基于prompt的表格事实检测方法。本发明首次在表格事实检测任务上使用Prompt方法,在小样本或零样本情况下有效的提高判断效果。首先是将表格事实检测任务形式改造成和预训练表格模型一致,不需要在预训练模型的基础上做过多训练;其次是定义了一个多组的映射关系,可以方便的将prompt的预测结果转化为表格事实检测结果。

    一种基于Text-to-SQL的表格开放域问答方法

    公开(公告)号:CN115563248A

    公开(公告)日:2023-01-03

    申请号:CN202211226678.2

    申请日:2022-10-09

    Abstract: 本发明属于自然语言处理和问答任务领域,涉及一种基于Text‑to‑SQL的表格开放域问答方法。首先使用检索器从表格语料库中初步筛选相关的表格得到表格池,然后按相似性分数排序得到前top‑k表格作为后续的输入;在提取回答时使用深度学习的Text‑to‑SQL模型,结合问句和表格模式信息将问句转换为SQL等的标准化的逻辑形式,在表格上执行SQL并判断执行结果是否发生错误;并以此结果作为相关性依据之一回溯至表格重排序,融入新一轮相似性计算中。本发明利用了Text‑to‑SQL模型的执行结果作为表格检索的相似性排序依据,使得所检索的表格更为准确,进而提升了整个开放域问答的结果准确性。

    一种基于TaPas模型和图注意力网络的表格问答处理方法

    公开(公告)号:CN115794871A

    公开(公告)日:2023-03-14

    申请号:CN202211563273.8

    申请日:2022-12-07

    Abstract: 本发明属于自然语言处理、表格问答技术领域,尤其是涉及一种基于TaPas模型和图注意力网络的表格问答处理方法。本发明提出使用图注意力神经网络来利用和融合TAPAS预训练模型提取的特征向量。在wikiSQL数据集上的实验结果表明,使用图注意力网络的TAPAS模型的准确度为87.0%,超过仅使用两个全连接层时TAPAS模型的准确度。同时,TAPAS模型对输入的表格问题对的文本长度是有限的,一般为512个符号,这就导致了TAPAS无法处理较大的表格。本发明提出了一种预处理表格的方法,通过提取表格中与问题有关的列,来缩小表格的大小,称这样的预处理操作为快照。在对表格做了快照之后,本发明的模型在WIkiSQL上的准确度上升至89.8%。

Patent Agency Ranking