一种序列到无序多树模型的三元组抽取方法

    公开(公告)号:CN117540739A

    公开(公告)日:2024-02-09

    申请号:CN202311284404.3

    申请日:2023-10-07

    Abstract: 本发明公开了一种序列到无序多树模型的三元组抽取方法,其特征在于,构建一编码器‑解码器框架,所述编码器‑解码器框架中的编码器包括嵌入层、IDCNN、BiLSTM和第一卷积层CNN;所述编码器‑解码器框架中的解码器包括LSTM、注意力机制层和第二卷积层CNN;本发明采用IDCNN+BiLSTM作为编码器,IDCNN结构采用了多尺度的卷积核,可以捕捉更长的上下文信息,能够提取更多特征,有助于提高模型性能;解码器通过使用无序多标签分类作为输出层,对实体和关系进行联合建模和结构化建模;每个层级中的节点是无序的,且不考虑预定义的三元组顺序,因此预测偏差不会累积并影响其他三元组。

Patent Agency Ranking