一种基于多语义特征的知识抽取方法

    公开(公告)号:CN115688752A

    公开(公告)日:2023-02-03

    申请号:CN202211131763.0

    申请日:2022-09-16

    Abstract: 本发明公开了一种基于多语义特征的知识抽取方法,所述基于多语义特征的知识抽取方法包括如下步骤:步骤一、语义向量表示;步骤二、特征编码;步骤三、实体识别;步骤四、关系分类。与现有技术相比的优点在于:本发明提出了一种新的关系三元组抽取方法。该方法首先对通过预训练语言模型获得单词向量表示,然后利用Bi‑LSTM对字符级特征进行特征编码,以及通过多头自注意力机制对上下文语义信息进行编码,获得句子的内部结构以及长距离依赖关系。然后将不同层次的语义特征进行拼接,得到高效的语义表示,为实体识别和关系分类提供更准确的特征向量,有效提高了抽取关系三元组的性能。

Patent Agency Ranking