-
公开(公告)号:CN118520110A
公开(公告)日:2024-08-20
申请号:CN202410638530.2
申请日:2024-05-22
Applicant: 桂林电子科技大学
IPC: G06F16/35 , G06F40/295 , G06F40/30 , G06F40/211 , G06F18/241 , G06N3/0455 , G06N3/0442 , G06N3/042
Abstract: 本发明公开了一种基于中文抽象语义表示和指针网络的事件抽取方法,首先通过预训练模型BERT获取原始句子的嵌入矩阵;然后利用双向门控循环单元强化嵌入矩阵的语义特征;接着将中文抽象语义表示的信息矩阵与增强后的句嵌入矩阵一起输入图注意网络,以捕获论元之间的交互关系和依存信息;最后使用指针网络同时抽取触发词和论元,以识别重叠的角色和嵌套的论元,并将模型应用于目标数据集以完成事件抽取任务。本发明提供的事件抽取方法能够有效解决中文事件抽取中多个论元的交互关系未充分利用、依存句法信息和语义依存信息未综合考虑、事件角色重叠和论元嵌套以及数据样本较少情况下事件抽取效果较差等问题,具有较高的准确度和较好的泛化性。
-
公开(公告)号:CN118887703A
公开(公告)日:2024-11-01
申请号:CN202411061423.4
申请日:2024-08-05
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种基于预训练模型的跨模态文本到行人图像检索方法及存储介质,本发明改进了掩蔽语言建模策略,使用全词掩码策略,能够更好的挖掘图像与文本之间的细粒度关系。并且运用文本的属性这一特征,利用交叉模态编码器进行文本与图像之间的融合交互,以此学习更多的信息,进一步还提供了一个基于软注意力模态融合模块,加入此模块可以促进相同语义类别间的模态信息交互,从而达到更好的检索性能。
-
公开(公告)号:CN119538937A
公开(公告)日:2025-02-28
申请号:CN202411688518.9
申请日:2024-11-25
Applicant: 桂林电子科技大学
IPC: G06F40/30 , G06F18/213 , G06F18/22 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/0499 , G06N3/09
Abstract: 本发明公开了一种基于RoBERTa‑wwm‑ext‑large预训练模型的中文语义匹配方法,所述方法通过预训练模型RoBERTa‑wwm‑ext‑large获取匹配文本的初始向量表示,利用特征注意力加强两个文本向量之间的语义交互;接着将文本向量送入卷积神经网络提取更多特征信息后,再输出到长短期记忆网络这些特征信息的时间序列依赖性,通过自注意力丰富文本向量的上下文信息;建立微调表示模型去处理初始文本连接向量,获得微调过的文本对连接向量。最后将这些文本向量输入到多层感知机网络,计算文本匹配结果。与现有的基于预训练模型的文本匹配算法比较,本发明具有较高的准确度和较好的泛化性。
-
-