一种基于自然语言处理的文档级关系抽取方法

    公开(公告)号:CN119938927A

    公开(公告)日:2025-05-06

    申请号:CN202510024751.5

    申请日:2025-01-07

    Inventor: 吴军华 窦志强

    Abstract: 本发明属于自然语言处理技术领域,旨在从长文本中识别和提取实体之间的关系,以解决现有关系抽取方法面临的特征表达不充分和上下文信息捕捉不准确的问题。该方法提出了一种基于多粒度特征融合、轴注意力机制和证据增强的文档级关系抽取模型,以提升抽取性能。模型采用多粒度特征融合,通过结合局部片段特征和全局语义特征,提供了更为丰富的上下文信息;用轴注意力机制动态调整不同轴向的注意力权重,提升了关系识别的准确性;通过证据增强,更全面地理解和判断实体间的关系。该方法适用于知识图谱构建、智能问答及信息检索等应用,能有效提升长文档中关系抽取的性能。

Patent Agency Ranking