-
公开(公告)号:CN116166812A
公开(公告)日:2023-05-26
申请号:CN202211610782.1
申请日:2022-12-12
Applicant: 中国科学院自动化研究所 , 国网天津市电力公司 , 中国电力科学研究院有限公司 , 国家电网有限公司
Abstract: 本发明提供一种知识图谱补全方法、装置、电子设备和存储介质,涉及自然语言处理技术领域,所述方法包括:获取当前迭代周期中知识图谱中的多个事实三元组;基于各事实三元组之间的逻辑规则,确定至少一个结论三元组;将候选三元组和候选三元组对应的标签输入联合表示学习模型,得到候选三元组对应的向量表示和最终评分值,联合表示学习模型的损失函数是基于逻辑规则的结论损失、最小化全局损失和L2范数确定的;基于结论三元组,确定推理三元组,基于推理三元组更新知识图谱,并基于更新后的知识图谱进行迭代表示学习,直至无法确定结论三元组为止。本发明可提高推理三元组的可解释性,并提高补全后知识图谱的准确度。
-
公开(公告)号:CN115759111A
公开(公告)日:2023-03-07
申请号:CN202211370706.8
申请日:2022-11-03
Applicant: 中国科学院自动化研究所
IPC: G06F40/30 , G06N3/0442 , G06N3/049 , G06N3/08
Abstract: 本发明提供一种语言解析方法、装置、电子设备及存储介质,该方法包括:获取待解析语言;确定所述待解析语言对应的目标向量序列;对所述目标向量序列进行预测,确定目标解码器对应的目标预测序列;根据所述目标向量序列、所述目标预测序列及获取的其它解码器对应的其它预测序列,确定所述待解析语言对应的目标解析结果。该方法用以解决现有技术中语言解析方法的实现过程具有一定的局限性,容易导致电子设备无法准确得到单目标语义解析结果的缺陷,实现电子设备可得到较为准确的待解析语言对应的目标解析结果。
-
公开(公告)号:CN115618863A
公开(公告)日:2023-01-17
申请号:CN202211643975.7
申请日:2022-12-20
Applicant: 中国科学院自动化研究所 , 国网天津市电力公司 , 国家电网有限公司
IPC: G06F40/284 , G06F40/30
Abstract: 本发明实施例提供一种文本事件序列生成方法、装置、设备和存储介质,属于文本处理技术领域,该方法包括:获取目标文本的第一事件序列;第一事件序列为乱序和/或不完整的事件序列;将目标文本的第一事件序列输入文本事件序列生成模型,得到目标文本的目标事件序列;其中,文本事件序列生成模型是基于样本文本的目标事件序列、样本文本的第一事件序列和目标损失训练得到的;目标损失是基于样本文本的第一事件序列的事件向量和样本文本的预测事件序列的事件向量确定的。本发明实施例的方法从事件序列中的事件语义这个全局角度进行文本事件序列生成模型的训练,使得训练后的文本事件序列生成模型可以基于事件语义准确的进行文本事件序列的生成。
-
公开(公告)号:CN115481740A
公开(公告)日:2022-12-16
申请号:CN202211058977.X
申请日:2022-08-30
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种解释指导的知识蒸馏方法、装置、电子设备及存储介质,该方法包括:基于预先设置的解释模式,生成用于表征教师模型的推理方式的第一解释结果;基于所述解释模式,生成用于表征学生模型的推理方式的第二解释结果;基于所述第一解释结果和所述第二解释结果,获取所述学生模型的训练损失函数;基于所述训练损失函数训练所述学生模型,以将所述教师模型中的知识蒸馏到所述学生模型中。本发明实施例在生成学生模型的训练损失函数时,考虑了教师模型与学生模型的推理方式,即使教师模型与学生模型的架构不同,考虑教师模型与学生模型的推理方式也能更好地将教师模型的知识蒸馏到学生模型中,可以有效提高学生模型的性能。
-
公开(公告)号:CN115238031A
公开(公告)日:2022-10-25
申请号:CN202210719711.9
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/332 , G06F16/335 , G06F16/36 , G06N5/02 , G06N5/04
Abstract: 本发明提供一种目标答案获取方法、装置、电子设备及存储介质,该方法包括:基于知识图谱的三元组,生成文本形式的证据库;基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;其中,所述证据链用于获取所述第一问题对应的答案;基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。本发明实施例能够适应推理复杂的真实场景,提高了推理类问答的准确率。
-
公开(公告)号:CN115222050A
公开(公告)日:2022-10-21
申请号:CN202210574007.9
申请日:2022-05-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种知识图谱的推理方法及装置,其中方法包括:获取目标知识图谱中实体文本对应的实体词向量,以及所述目标知识图谱中关系文本对应的关系词向量;将所述实体词向量和所述关系词向量输入对比学习模型,得到所述对比学习模型输出的所述实体词向量的实体对比学习向量以及所述关系词向量的关系对比学习向量;根据所述实体对比学习向量以及所述关系对比学习向量,确定所述目标知识图谱的推理结果。本发明提供的知识图谱的推理方法及装置,通过对比学习模型获取的实体对比学习向量以及关系对比学习向量用于后续知识图谱的推理,由于相似词向量间的差异更大,不相似词向量间的差异更小,提升了知识图谱推理的准确率。
-
公开(公告)号:CN110442693B
公开(公告)日:2022-02-22
申请号:CN201910685616.X
申请日:2019-07-27
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F40/284
Abstract: 本发明提供了一种基于人工智能的回复消息生成方法、装置、服务器及介质,属于人工智能技术领域。方法包括:获取目标用户的会话消息;将会话消息输入多级编码器中,多级编码器包括多个级联的编码器;根据多个编码器的级联关系,控制每个编码器分别根据每个编码器对应的词汇表以及上一级编码器的状态信息生成会话消息的编码序列;根据多级解码器包括的多个解码器的级联关系,控制每个解码器分别根据多个编码器生成的编码序列、上级解码器生成的第一解码序列以及对应的编码器的状态信息生成第二解码序列,多个解码器与多个编码器一一对应;根据多级解码器生成的解码序列,输出会话消息的回复消息。使得生成的回复消息更加顺畅流利,质量较高。
-
公开(公告)号:CN110941962B
公开(公告)日:2021-09-28
申请号:CN201911173056.6
申请日:2019-11-26
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/30 , G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于图网络的答案句选择方法和装置。为了解决现有技术未考虑候选句之间的关联度导致答案选择错误的问题,本发明提出一种基于图网络的答案句选择方法,该方法包括对预先获取的多个第一句子,分别获取对应的第一向量;根据第一句子和第一向量构建多个第一句子的关系图;基于关系图以及第一向量,通过图网络获取第二向量,其中,图网络基于神经网络构建,第二向量为多个第一句子的上下文信息融合后的向量;基于第二向量,通过问答句预测器从第一句子中选择答案句,其中,问答句预测器用于获取第二向量对应的第一句子的预测分数。利用本发明的方法能够提高从候选句中选择正确答案的概率。
-
公开(公告)号:CN111858898A
公开(公告)日:2020-10-30
申请号:CN202010753509.9
申请日:2020-07-30
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F40/211 , G06F40/289 , G06N3/04
Abstract: 本申请提供了一种基于人工智能的文本处理方法、装置、电子设备及计算机可读存储介质;方法包括:对文本中属于同一句子的多个词语进行特征提取处理,得到多个词语的特征表示,以作为句子的句子级信息;对文本中的多个句子进行特征提取处理,得到多个句子的特征表示,以作为文本级信息;从知识库中获取文本中属于同一句子的多个词语的设定特征表示,以作为句子的设定信息;针对文本中的每个词语,根据词语所在句子的句子级信息、文本级信息、以及词语所在句子的设定信息,更新词语的特征表示,并根据词语的更新后的特征表示进行类型预测处理,得到词语的预测类型。通过本申请,能够提升得到的预测类型的精度,进而能够提升问答服务的智能化程度。
-
公开(公告)号:CN108345583B
公开(公告)日:2020-07-28
申请号:CN201711463578.0
申请日:2017-12-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于多语注意力机制的事件识别及分类方法及装置,旨在为了解决单语特征识别效果不能满足需求的问题,本发明的方法包括:将仅标注单语事件信息的数据映射为多语平行数据;将所述多语平行数据进行词汇级别对齐,通过多语对齐关系得到同一事件在多种不同语言中的一致性表示;基于单语注意力模型获取多语一致性信息;基于多语注意力模型获取多语互补性信息;基于所述多语一致性信息和所述多语互补性信息进行联合推理,通过非线性神经网络判别模型输出最终的识别结果。本发明可以提高事件的识别效果。
-
-
-
-
-
-
-
-
-