-
公开(公告)号:CN113779190A
公开(公告)日:2021-12-10
申请号:CN202110819756.9
申请日:2021-07-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,所述方法包括:基于待识别的事件对所在的文本,确定所述事件对的上下文表示;将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够充分挖掘事件对之间的因果关系信息,避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高事件因果关系识别的准确性。
-
公开(公告)号:CN113761874A
公开(公告)日:2021-12-07
申请号:CN202110815460.X
申请日:2021-07-19
Applicant: 中国科学院自动化研究所
IPC: G06F40/211 , G06F40/253 , G06F40/289 , G06F40/30 , G06N3/04 , G06K9/62
Abstract: 本发明提供一种事件事实性预测方法、装置、电子设备与存储介质,所述方法包括:确定待分析的句子;将所述句子输入至事实性预测模型,得到事实性预测模型输出的所述句子中各个事件触发词的事实性取值;其中,所述事实性预测模型基于稀疏自注意力机制提取所述句子的语义图,并基于所述句子的语义图和句法图进行事实性预测;所述句法图是对所述句子进行句法分析得到的;所述事实性预测模型是基于样本句子以及所述样本句子中各个样本事件触发词的样本事实性取值训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够极大地提高事件事实性预测的准确性,减轻句法分析工具带来的误差累积问题。
-
公开(公告)号:CN111881688B
公开(公告)日:2021-09-14
申请号:CN202010801363.0
申请日:2020-08-11
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于屏蔽泛化机制的事件因果关系识别方法、系统、装置,旨在解决模型训练困难以及事件因果关系识别鲁棒性较差的问题。本发明方法包括:获取待识别事件因果关系的文本,作为输入文本;通过BERT模型提取输入文本与因果事件的实体信息对应的三元组集合融合后的特征,作为第一特征;通过BERT模型提取输入文本中未屏蔽信息的特征,作为第二特征;将第一特征、第二特征进行融合,将融合后的特征作为第三特征;基于第三特征,通过预构建的分类模型获取输入文本中事件因果关系的识别结果。本发明简化了模型训练的难度,并提高了事件因果关系识别的鲁棒性。
-
公开(公告)号:CN112101484A
公开(公告)日:2020-12-18
申请号:CN202011244409.X
申请日:2020-11-10
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于知识巩固的增量事件识别方法、系统、装置,旨在解决现有的事件识别方法在微调模型后识别新类别的事件时,容易出现灾难遗忘,导致识别精度较低的问题。本系统方法包括获取待识别事件的文本,作为输入文本;通过预训练的语言模型提取输入文本中各单词的上下文特征;基于所述上下文特征,通过多层感知器模型得到待识别事件的类别。本发明提高了事件识别的精度。
-
公开(公告)号:CN111046671A
公开(公告)日:2020-04-21
申请号:CN201911275401.7
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/211
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于图网络融入词典的中文命名实体识别方法、系统、装置,旨在解决基于字的模型的中文命名实体识别方法没有利用词的信息,导致命名实体的识别精度较低的问题。本系统方法包括获取待识别语句的字向量表示,基于字向量表示,通过双向长短期记忆网络得到待识别语句的句子表示;基于待识别语句,获取其与预设的词典匹配的词的向量表示;将句子表示、词的向量表示进行拼接,通过图网络获取融合多种词典知识的句子表示;基于融合多种词典知识的句子表示,采用条件随机场算法和维特比解码算法获取命名实体的识别结果。本发明提高了中文命名实体的识别精度。
-
公开(公告)号:CN109783812A
公开(公告)日:2019-05-21
申请号:CN201811621018.8
申请日:2018-12-28
Applicant: 中国科学院自动化研究所
IPC: G06F17/27
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于自注意力机制的中文命名实体识别方法、系统、装置,旨在为了解决解决中文命名实体识别的准确度不能满足需求的问题。本发明方法包括:提取待识别语句的私有特征h1、共有特征s1;基于自注意力机制分别计算共有特征s1、私有特征h1对应的长距离依赖关系,获取基于依赖关系的私有特征h′1、基于依赖关系的共有特征s′1;通过任务分类器判断所述待识别语句是否为中文命名实体识别数据时将h′1与s′1进行拼接,获取融合后的中文命名实体识别数据特征h″1,采用条件随即场对融合之后的特征h″1进行标签预测。本发明有效地提高了中文命名实体识别的准确度。
-
-
-
-
-