基于抽象语义表示和指针网络的事件抽取方法及存储介质

    公开(公告)号:CN118520110A

    公开(公告)日:2024-08-20

    申请号:CN202410638530.2

    申请日:2024-05-22

    Abstract: 本发明公开了一种基于中文抽象语义表示和指针网络的事件抽取方法,首先通过预训练模型BERT获取原始句子的嵌入矩阵;然后利用双向门控循环单元强化嵌入矩阵的语义特征;接着将中文抽象语义表示的信息矩阵与增强后的句嵌入矩阵一起输入图注意网络,以捕获论元之间的交互关系和依存信息;最后使用指针网络同时抽取触发词和论元,以识别重叠的角色和嵌套的论元,并将模型应用于目标数据集以完成事件抽取任务。本发明提供的事件抽取方法能够有效解决中文事件抽取中多个论元的交互关系未充分利用、依存句法信息和语义依存信息未综合考虑、事件角色重叠和论元嵌套以及数据样本较少情况下事件抽取效果较差等问题,具有较高的准确度和较好的泛化性。

    基于RoBERTa-wwm-ext-large预训练模型的中文语义匹配方法

    公开(公告)号:CN119538937A

    公开(公告)日:2025-02-28

    申请号:CN202411688518.9

    申请日:2024-11-25

    Abstract: 本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法,所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示,利用特征注意力加强两个文本向量之间的语义交互;接着将文本向量送入卷积神经网络提取更多特征信息后,再输出到长短期记忆网络这些特征信息的时间序列依赖性,通过自注意力丰富文本向量的上下文信息;建立微调表示模型去处理初始文本连接向量,获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络,计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较,本发明具有较高的准确度和较好的泛化性。

Patent Agency Ranking