-
公开(公告)号:CN113222119B
公开(公告)日:2022-09-20
申请号:CN202110594279.0
申请日:2021-05-28
Applicant: 北京理工大学
IPC: G06N3/04 , G06N3/08 , G06F40/284 , G06F16/28
Abstract: 本发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。主要为了解决采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题。本发明首先利用BERT预训练模型对数据集实现文本嵌入,得到文本嵌入向量,触发词类别嵌入向量和实体类别嵌入向量;然后对候选论元、实体类别和触发词之间的拓扑关系进项建模,构建多视角图信息网络;最后利用图卷积网络分别对多视角图编码,聚合得到候选论元多视角图嵌入向量,经过SoftMax全连接层从候选论元中分类抽取事件论元。在ACE2005英文语料上进行实验,结果表明本发明能达到较好的论元抽取效果。
-
公开(公告)号:CN113222119A
公开(公告)日:2021-08-06
申请号:CN202110594279.0
申请日:2021-05-28
Applicant: 北京理工大学
IPC: G06N3/04 , G06N3/08 , G06F40/284 , G06F16/28
Abstract: 本发明涉及利用拓扑依存关系多视角图编码器的论元抽取方法,属于自然语言处理与机器学习领域。主要为了解决采用单类型特征建模提取论元时,造成多种角色的论元特征表示易受到与候选论元无语义关联信息的干扰,导致多角色论元的特征表示不准确的问题。本发明首先利用BERT预训练模型对数据集实现文本嵌入,得到文本嵌入向量,触发词类别嵌入向量和实体类别嵌入向量;然后对候选论元、实体类别和触发词之间的拓扑关系进项建模,构建多视角图信息网络;最后利用图卷积网络分别对多视角图编码,聚合得到候选论元多视角图嵌入向量,经过SoftMax全连接层从候选论元中分类抽取事件论元。在ACE2005英文语料上进行实验,结果表明本发明能达到较好的论元抽取效果。
-