基于实体义项的字和词特征融合的中文实体关系抽取方法

    公开(公告)号:CN111291556B

    公开(公告)日:2021-10-26

    申请号:CN201911298675.8

    申请日:2019-12-17

    Applicant: 东华大学

    Abstract: 本发明涉及一种基于实体义项的字和词特征融合的中文实体关系抽取方法。该方法引入实体义项将语句扩充为三元组 ,丰富了输入细粒度,对三元组中的三个序列分别映射成字向量矩阵。对三元组中的语句,并行输入到两个模型,一个基于注意力机制的双向长短时记忆网络(Att‑BLSTM)学习字特征,另一个先通过卷积神经网络(CNN)学习局部特征,再通过Att‑BLSTM学习词特征。分别利用Att‑BLSTM学习基于字的实体1义项特征和基于字的实体2义项特征。将所述四种特征融合成一个可全面表征语义信息的特征,用于关系抽取。该方法能避免分词错误且解决一词多义问题,有效提高中文实体关系抽取的准确率,可广泛应用于构建知识图谱。

    基于实体义项的字和词特征融合的中文实体关系抽取方法

    公开(公告)号:CN111291556A

    公开(公告)日:2020-06-16

    申请号:CN201911298675.8

    申请日:2019-12-17

    Applicant: 东华大学

    Abstract: 本发明涉及一种基于实体义项的字和词特征融合的中文实体关系抽取方法。该方法引入实体义项将语句扩充为三元组 ,丰富了输入细粒度,对三元组中的三个序列分别映射成字向量矩阵。对三元组中的语句,并行输入到两个模型,一个基于注意力机制的双向长短时记忆网络(Att-BLSTM)学习字特征,另一个先通过卷积神经网络(CNN)学习局部特征,再通过Att-BLSTM学习词特征。分别利用Att-BLSTM学习基于字的实体1义项特征和基于字的实体2义项特征。将所述四种特征融合成一个可全面表征语义信息的特征,用于关系抽取。该方法能避免分词错误且解决一词多义问题,有效提高中文实体关系抽取的准确率,可广泛应用于构建知识图谱。

Patent Agency Ranking