一种使用两阶段检索的文本多跳推理问答方法

    公开(公告)号:CN116383347A

    公开(公告)日:2023-07-04

    申请号:CN202211104039.9

    申请日:2022-09-09

    Applicant: 燕山大学

    Abstract: 本发明公开了一种使用两阶段检索的文本多跳推理问答方法,及自然语言处理技术领域,方法包括两个模块。首先,在上下文感知知识检索器模块中,使用具有掩码机制的双编码器框架进行预训练,再将学习到的假设和知识的表示基于句子级密集检索获得候选核心知识。其次,在实体感知知识验证模块中,通过实体级稀疏矩阵确定假设和知识的可达性,将用于进一步验证核心知识和假设之间是否存在支撑关系。本方法将上下文感知和实体感知的知识检索方法结合应用到推理过程中,改进以实体为中心的推理的盲目性,使模型同时考虑假设和知识之间的上下文语义匹配和实体概念影响。在需要复杂多跳的科学问答领域中,具有明显的性能优势。

    实体层次信息增强原型表征的小样本命名实体识别方法

    公开(公告)号:CN116451691A

    公开(公告)日:2023-07-18

    申请号:CN202310297189.4

    申请日:2023-03-24

    Applicant: 燕山大学

    Abstract: 本发明公开了一种实体层次信息增强原型表征的小样本命名实体识别方法,属于自然语言处理技术领域。主要包括两个模块:1)边界识别模块:将训练数据输入到边界识别模块,检测实体跨度在句子中的边界;2)实体分类模块:使用同一个编码器训练数据和实体层次的分支描述进行编码,得到分支描述表征和原始原型表征;通过三仿射注意力机制将实体层次的分支描述融入到原始原型表征中,得到层次指导的原型表征;使用层次‑示例对比学习方法,拉进与层次原型同类样本之间的距离,拉远与之不同类样本的距离。本发明方法通过挖掘文本描述的实体层次信息,向原型表征中引入实体层次信息能够有效增强实体类原型的表征能力,从而增强小样本命名实体识别能力。

Patent Agency Ranking