-
公开(公告)号:CN113761925B
公开(公告)日:2022-10-28
申请号:CN202110837136.8
申请日:2021-07-23
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/216 , G06K9/62
Abstract: 本发明提供一种基于噪声感知机制的命名实体识别方法、装置及设备,其中方法包括:确定待识别文本;将待识别文本输入至命名实体识别模型,得到命名实体识别模型输出的识别结果;命名实体识别模型是基于干净样本集合训练得到的,干净样本集合是基于原始样本集合中各样本文本的训练统计量,对原始样本集合进行噪声筛除得到的,训练统计量是在基于样本文本进行训练过程中统计的预测结果和标签之间的差异。本发明提供的方法、装置、电子设备和存储介质,能够通过获取待识别文本的识别结果,根据识别结果对待识别文本进行命名实体类型判定,克服了命名实体识别数据集中正确样本和噪声样本难以区分的问题,实现了待识别文本的命名实体类型的精确识别。
-
公开(公告)号:CN115238705A
公开(公告)日:2022-10-25
申请号:CN202210731235.2
申请日:2022-06-24
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06F40/205 , G06F16/31 , G06F16/33 , G06F16/338 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种语义解析结果重排序方法及系统,该方法包括:通过语义解析器,对目标自然语言语句进行解析,得到所述目标自然语言语句的候选逻辑表示集合;将所述目标自然语言语句和所述候选逻辑表示集合输入到重排序模型,得到候选语义重排序结果;根据所述候选语义重排序结果,确定所述目标自然语言语句的目标逻辑表示;其中,所述重排序模型是基于样本自然语言语句对应的自然语言相似样本和样本候选逻辑表示预测结果对应的逻辑表示相似样本,对预训练的深度神经网络进行训练得到的。本发明通过对语义解析结果进行重排序,有助于进一步搜索概率空间,从而根据重排序结果确定最终的语义解析结果,提高语义解析中推理算法的性能和准确性。
-
公开(公告)号:CN113779190A
公开(公告)日:2021-12-10
申请号:CN202110819756.9
申请日:2021-07-20
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种事件因果关系识别方法、装置、电子设备与存储介质,所述方法包括:基于待识别的事件对所在的文本,确定所述事件对的上下文表示;将所述事件对的上下文表示,以及与所述事件对相关的描述性知识和关联性知识输入至因果关系识别模型,得到所述因果关系识别模型输出的所述事件对的因果关系;其中,所述因果关系识别模型是基于样本事件对的上下文表示,与所述样本事件对相关的样本描述性知识和样本关联性知识,以及所述样本事件对的因果关系训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够充分挖掘事件对之间的因果关系信息,避免显式线索缺乏导致事件因果关系无法识别的问题,极大地提高事件因果关系识别的准确性。
-
公开(公告)号:CN113761874A
公开(公告)日:2021-12-07
申请号:CN202110815460.X
申请日:2021-07-19
Applicant: 中国科学院自动化研究所
IPC: G06F40/211 , G06F40/253 , G06F40/289 , G06F40/30 , G06N3/04 , G06K9/62
Abstract: 本发明提供一种事件事实性预测方法、装置、电子设备与存储介质,所述方法包括:确定待分析的句子;将所述句子输入至事实性预测模型,得到事实性预测模型输出的所述句子中各个事件触发词的事实性取值;其中,所述事实性预测模型基于稀疏自注意力机制提取所述句子的语义图,并基于所述句子的语义图和句法图进行事实性预测;所述句法图是对所述句子进行句法分析得到的;所述事实性预测模型是基于样本句子以及所述样本句子中各个样本事件触发词的样本事实性取值训练得到的。本发明提供的方法、装置、电子设备与存储介质,能够极大地提高事件事实性预测的准确性,减轻句法分析工具带来的误差累积问题。
-
公开(公告)号:CN111881688B
公开(公告)日:2021-09-14
申请号:CN202010801363.0
申请日:2020-08-11
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06K9/62 , G06N3/04
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于屏蔽泛化机制的事件因果关系识别方法、系统、装置,旨在解决模型训练困难以及事件因果关系识别鲁棒性较差的问题。本发明方法包括:获取待识别事件因果关系的文本,作为输入文本;通过BERT模型提取输入文本与因果事件的实体信息对应的三元组集合融合后的特征,作为第一特征;通过BERT模型提取输入文本中未屏蔽信息的特征,作为第二特征;将第一特征、第二特征进行融合,将融合后的特征作为第三特征;基于第三特征,通过预构建的分类模型获取输入文本中事件因果关系的识别结果。本发明简化了模型训练的难度,并提高了事件因果关系识别的鲁棒性。
-
公开(公告)号:CN112101484A
公开(公告)日:2020-12-18
申请号:CN202011244409.X
申请日:2020-11-10
Applicant: 中国科学院自动化研究所
IPC: G06K9/62
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于知识巩固的增量事件识别方法、系统、装置,旨在解决现有的事件识别方法在微调模型后识别新类别的事件时,容易出现灾难遗忘,导致识别精度较低的问题。本系统方法包括获取待识别事件的文本,作为输入文本;通过预训练的语言模型提取输入文本中各单词的上下文特征;基于所述上下文特征,通过多层感知器模型得到待识别事件的类别。本发明提高了事件识别的精度。
-
公开(公告)号:CN111061850A
公开(公告)日:2020-04-24
申请号:CN201911276031.9
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06K9/62
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于信息增强的对话状态跟踪方法、系统、装置,旨在解决现有对话状态跟踪方法仅利用对话文本的上下文信息生成的未知槽值的准确度较差的问题。本系统方法包括基于用户t时刻的对话文本,通过对话状态跟踪模型得到t时刻的对话状态;t时刻的对话状态包括一或多个槽值对及对应的概率;所述槽值对包括槽、槽值;所述对话状态跟踪模型基于编码器-解码器架构的神经网络构建。本发明提高了未知槽值生成的准确度。
-
公开(公告)号:CN111046671A
公开(公告)日:2020-04-21
申请号:CN201911275401.7
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/211
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于图网络融入词典的中文命名实体识别方法、系统、装置,旨在解决基于字的模型的中文命名实体识别方法没有利用词的信息,导致命名实体的识别精度较低的问题。本系统方法包括获取待识别语句的字向量表示,基于字向量表示,通过双向长短期记忆网络得到待识别语句的句子表示;基于待识别语句,获取其与预设的词典匹配的词的向量表示;将句子表示、词的向量表示进行拼接,通过图网络获取融合多种词典知识的句子表示;基于融合多种词典知识的句子表示,采用条件随机场算法和维特比解码算法获取命名实体的识别结果。本发明提高了中文命名实体的识别精度。
-
公开(公告)号:CN109783812A
公开(公告)日:2019-05-21
申请号:CN201811621018.8
申请日:2018-12-28
Applicant: 中国科学院自动化研究所
IPC: G06F17/27
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于自注意力机制的中文命名实体识别方法、系统、装置,旨在为了解决解决中文命名实体识别的准确度不能满足需求的问题。本发明方法包括:提取待识别语句的私有特征h1、共有特征s1;基于自注意力机制分别计算共有特征s1、私有特征h1对应的长距离依赖关系,获取基于依赖关系的私有特征h′1、基于依赖关系的共有特征s′1;通过任务分类器判断所述待识别语句是否为中文命名实体识别数据时将h′1与s′1进行拼接,获取融合后的中文命名实体识别数据特征h″1,采用条件随即场对融合之后的特征h″1进行标签预测。本发明有效地提高了中文命名实体识别的准确度。
-
公开(公告)号:CN108280058A
公开(公告)日:2018-07-13
申请号:CN201810003062.6
申请日:2018-01-02
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及自然语言处理技术领域,具体提供了一种基于强化学习的关系抽取方法和装置,旨在解决如何在弱监督数据中进行关系抽取的技术问题。为此目的,本发明中的基于强化学习的关系抽取方法,包括下述步骤:获取句子中各词的词向量和各词的位置向量;依据各词的词向量和位置向量,利用预设关系抽取器获取句子的关系类别;其中,预设关系抽取器为基于神经网络构建的模型,包括用于获取各词对应的词的向量表示的向量表示层,用于获取特征映射向量的卷积神经网络层,用于获取最终句子的向量表示的池化层,用于获取句子的关系类别的分类器层。通过本发明可以利用有监督模型在弱监督数据中获取句子的关系类别。
-
-
-
-
-
-
-
-
-