一种基于字词特征和指针网络的中文事件抽取方法及系统

    公开(公告)号:CN119514534A

    公开(公告)日:2025-02-25

    申请号:CN202411608235.9

    申请日:2024-11-12

    Abstract: 本发明提供了一种基于字词特征和指针网络的中文事件抽取方法及系统,所述方法包括如下步骤:将原始中文序列输入到BERT模型中,进行切分并编码转换成高维向量以实现分字处理,并采用jieba分词工具对文本进行分词处理;将字符级向量和词级别向量分别输入到BiLSTM网络中进行字词特征提取,通过注意力机制进行字词特征融合;利用双序列指针网络分别识别触发词和论元的起始位置,实现从文本中抽取。本发明的中文事件抽取方法在于解决中文事件抽取中存在的语义表征不充分、角色重叠和论元嵌套等问题,提高事件抽取模型的准确率和泛化能力。

    基于特征融合的多角度文本匹配方法及存储介质

    公开(公告)号:CN118484512A

    公开(公告)日:2024-08-13

    申请号:CN202410638730.8

    申请日:2024-05-22

    Abstract: 本发明公开了一种基于特征融合的多角度文本匹配方法,首先对文本进行字和词两种粒度的划分,基于字粒度获取文本的部首以及拼音表示并对字、词、部首和拼音分别进行初始编码,使用LeNet提取字形初始特征。其次,使用双向LSTM捕获初始编码中的语义信息并使用软对齐注意力机制(Soft Align Attention,SaAttention)进行不同粒度特征上的语义对齐。再次,使用卷积神经网络进一步提升向量的语义表征能力,使用多角度匹配模块进行特征间的深度交互。最后,使用LSTM进一步挖掘语义信息,使用GRU进行特征融合以生成更具丰富语义的匹配向量,从而提升中文文本匹配的准确性。

Patent Agency Ranking