-
公开(公告)号:CN113901990A
公开(公告)日:2022-01-07
申请号:CN202111078776.1
申请日:2021-09-15
Applicant: 昆明理工大学
IPC: G06K9/62 , G06N20/20 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明涉及多视角集成学习的案件与新闻相关性分析方法,属于自然语言处理技术领域。本发明包括步骤:以孪生网络为基础框架,并结合CNN网络、Transformer编码网络以及主题模型来实现局部信息、结构信息以及主题信息的特征抽取,考虑到案件要素蕴含案件的关键语义信息,将案件要素用于指导三个预训练基学习器获取指向性信息,再通过多头自注意力机制构建权重学习器,结合三种指向性信息并计算曼哈顿距离,最终获取到更为均衡合理的相似性关系。实验结果表明本发明多视角集成的方法相比基于语义相似度的方法F1值提升了2.5%。
-
公开(公告)号:CN114925168B
公开(公告)日:2024-08-09
申请号:CN202210567309.3
申请日:2022-05-24
Applicant: 昆明理工大学
IPC: G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06F18/24 , G06N3/0475 , G06N3/045 , G06N3/094 , G06N3/0455 , G06N3/048
Abstract: 本发明涉及基于生成对抗网络的越南语新闻事件共指关系识别方法,属自然语言处理领域。本发明的事件共指关系识别任务需要识别新闻文档中事件描述句之间是否从不同的角度对同一件真实事情展开论述。针对事件信息比实体信息复杂导致事件共指关系识别的难度远远大于实体共指消解,以及在越南语新闻文档中存在不同事件句之间具有相似上下文但不具有共指关系的情况,而容易对模型造成困惑。因此,本发明采用事件上下文作为事件句的表征,并通过生成对抗网络来缓解文本中的噪声数据,以提高面向越南语新闻的事件共指关系识别的性能。在构建的越南语事件数据集上进行实验验证,结果表明,所提方法较基线模型取得了更好的效果。
-
公开(公告)号:CN114925168A
公开(公告)日:2022-08-19
申请号:CN202210567309.3
申请日:2022-05-24
Applicant: 昆明理工大学
Abstract: 本发明涉及基于生成对抗网络的越南语新闻事件共指关系识别方法,属自然语言处理领域。本发明的事件共指关系识别任务需要识别新闻文档中事件描述句之间是否从不同的角度对同一件真实事情展开论述。针对事件信息比实体信息复杂导致事件共指关系识别的难度远远大于实体共指消解,以及在越南语新闻文档中存在不同事件句之间具有相似上下文但不具有共指关系的情况,而容易对模型造成困惑。因此,本发明采用事件上下文作为事件句的表征,并通过生成对抗网络来缓解文本中的噪声数据,以提高面向越南语新闻的事件共指关系识别的性能。在构建的越南语事件数据集上进行实验验证,结果表明,所提方法较基线模型取得了更好的效果。
-
公开(公告)号:CN113239142B
公开(公告)日:2022-09-23
申请号:CN202110451650.8
申请日:2021-04-26
Applicant: 昆明理工大学
IPC: G06F16/33 , G06F40/211 , G06F40/30 , G06N3/04
Abstract: 本发明涉及融合句法信息的无触发词事件检测方法,属于自然语言处理技术领域。本发明首先获取预处理语料的句法依存信息以及进行BPE编码获取子词单元;将基于BPE子词单元的句子转为ID之后,再通过随机初始化获取句子中每个子词单元的向量表示;根据句子BPE编码后的子词单元数量来计算出每个单词的中间位置,然后将每个单词映射为其父词的中间位置表示;采用transformer作为编码器,将句法信息与文本的语义信息进行融合;最后通过类型感知器获取局部的触发词特征,再将局部的触发词特征与全局的语义表征进行联合,来完成事件检测任务。本发明的检测方法更简便有效。
-
公开(公告)号:CN113239142A
公开(公告)日:2021-08-10
申请号:CN202110451650.8
申请日:2021-04-26
Applicant: 昆明理工大学
IPC: G06F16/33 , G06F40/211 , G06F40/30 , G06N3/04
Abstract: 本发明涉及融合句法信息的无触发词事件检测方法,属于自然语言处理技术领域。本发明首先获取预处理语料的句法依存信息以及进行BPE编码获取子词单元;将基于BPE子词单元的句子转为ID之后,再通过随机初始化获取句子中每个子词单元的向量表示;根据句子BPE编码后的子词单元数量来计算出每个单词的中间位置,然后将每个单词映射为其父词的中间位置表示;采用transformer作为编码器,将句法信息与文本的语义信息进行融合;最后通过类型感知器获取局部的触发词特征,再将局部的触发词特征与全局的语义表征进行联合,来完成事件检测任务。本发明的检测方法更简便有效。
-
-
-
-