-
公开(公告)号:CN115238031A
公开(公告)日:2022-10-25
申请号:CN202210719711.9
申请日:2022-06-23
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/332 , G06F16/335 , G06F16/36 , G06N5/02 , G06N5/04
Abstract: 本发明提供一种目标答案获取方法、装置、电子设备及存储介质,该方法包括:基于知识图谱的三元组,生成文本形式的证据库;基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;其中,所述证据链用于获取所述第一问题对应的答案;基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。本发明实施例能够适应推理复杂的真实场景,提高了推理类问答的准确率。
-
公开(公告)号:CN115222050A
公开(公告)日:2022-10-21
申请号:CN202210574007.9
申请日:2022-05-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种知识图谱的推理方法及装置,其中方法包括:获取目标知识图谱中实体文本对应的实体词向量,以及所述目标知识图谱中关系文本对应的关系词向量;将所述实体词向量和所述关系词向量输入对比学习模型,得到所述对比学习模型输出的所述实体词向量的实体对比学习向量以及所述关系词向量的关系对比学习向量;根据所述实体对比学习向量以及所述关系对比学习向量,确定所述目标知识图谱的推理结果。本发明提供的知识图谱的推理方法及装置,通过对比学习模型获取的实体对比学习向量以及关系对比学习向量用于后续知识图谱的推理,由于相似词向量间的差异更大,不相似词向量间的差异更小,提升了知识图谱推理的准确率。
-
公开(公告)号:CN110442693B
公开(公告)日:2022-02-22
申请号:CN201910685616.X
申请日:2019-07-27
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F40/284
Abstract: 本发明提供了一种基于人工智能的回复消息生成方法、装置、服务器及介质,属于人工智能技术领域。方法包括:获取目标用户的会话消息;将会话消息输入多级编码器中,多级编码器包括多个级联的编码器;根据多个编码器的级联关系,控制每个编码器分别根据每个编码器对应的词汇表以及上一级编码器的状态信息生成会话消息的编码序列;根据多级解码器包括的多个解码器的级联关系,控制每个解码器分别根据多个编码器生成的编码序列、上级解码器生成的第一解码序列以及对应的编码器的状态信息生成第二解码序列,多个解码器与多个编码器一一对应;根据多级解码器生成的解码序列,输出会话消息的回复消息。使得生成的回复消息更加顺畅流利,质量较高。
-
公开(公告)号:CN110941962B
公开(公告)日:2021-09-28
申请号:CN201911173056.6
申请日:2019-11-26
Applicant: 中国科学院自动化研究所
IPC: G06F40/295 , G06F40/30 , G06F16/332 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于图网络的答案句选择方法和装置。为了解决现有技术未考虑候选句之间的关联度导致答案选择错误的问题,本发明提出一种基于图网络的答案句选择方法,该方法包括对预先获取的多个第一句子,分别获取对应的第一向量;根据第一句子和第一向量构建多个第一句子的关系图;基于关系图以及第一向量,通过图网络获取第二向量,其中,图网络基于神经网络构建,第二向量为多个第一句子的上下文信息融合后的向量;基于第二向量,通过问答句预测器从第一句子中选择答案句,其中,问答句预测器用于获取第二向量对应的第一句子的预测分数。利用本发明的方法能够提高从候选句中选择正确答案的概率。
-
公开(公告)号:CN111858898A
公开(公告)日:2020-10-30
申请号:CN202010753509.9
申请日:2020-07-30
Applicant: 中国科学院自动化研究所 , 腾讯科技(深圳)有限公司
IPC: G06F16/332 , G06F40/211 , G06F40/289 , G06N3/04
Abstract: 本申请提供了一种基于人工智能的文本处理方法、装置、电子设备及计算机可读存储介质;方法包括:对文本中属于同一句子的多个词语进行特征提取处理,得到多个词语的特征表示,以作为句子的句子级信息;对文本中的多个句子进行特征提取处理,得到多个句子的特征表示,以作为文本级信息;从知识库中获取文本中属于同一句子的多个词语的设定特征表示,以作为句子的设定信息;针对文本中的每个词语,根据词语所在句子的句子级信息、文本级信息、以及词语所在句子的设定信息,更新词语的特征表示,并根据词语的更新后的特征表示进行类型预测处理,得到词语的预测类型。通过本申请,能够提升得到的预测类型的精度,进而能够提升问答服务的智能化程度。
-
公开(公告)号:CN108345583B
公开(公告)日:2020-07-28
申请号:CN201711463578.0
申请日:2017-12-28
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及自然语言处理技术领域,具体涉及一种基于多语注意力机制的事件识别及分类方法及装置,旨在为了解决单语特征识别效果不能满足需求的问题,本发明的方法包括:将仅标注单语事件信息的数据映射为多语平行数据;将所述多语平行数据进行词汇级别对齐,通过多语对齐关系得到同一事件在多种不同语言中的一致性表示;基于单语注意力模型获取多语一致性信息;基于多语注意力模型获取多语互补性信息;基于所述多语一致性信息和所述多语互补性信息进行联合推理,通过非线性神经网络判别模型输出最终的识别结果。本发明可以提高事件的识别效果。
-
公开(公告)号:CN111078836A
公开(公告)日:2020-04-28
申请号:CN201911259849.X
申请日:2019-12-10
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于外部知识增强的机器阅读理解方法、系统、装置,旨在解决现有机器阅读理解方法未利用三元组间的图结构信息,导致答案预测准确率较低的问题。本系统方法包括生成问题及原文文本中各实体的上下文表示;基于外部知识库,获取问题及原文文本中各实体的三元组集合及原文文本中各实体相邻实体的三元组集合;并基于三元组集合,通过外部知识图谱获取各实体的知识子图;通过图注意力网络更新融合知识子图,获取知识表示;通过哨兵机制将上下文表示和知识表示进行拼接,通过多层感知器和softmax分类器获取待回答问题的答案。本发明通过利用三元组之间的图结构信息,提高了答案预测的准确率。
-
公开(公告)号:CN111061851A
公开(公告)日:2020-04-24
申请号:CN201911276552.4
申请日:2019-12-12
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06N5/02
Abstract: 本发明涉及一种基于给定事实的问句生成方法及系统所述问句生成方法包括:获取历史参考数据,所述历史参考数据包括多条不同用户的历史输入信息;对各历史输入信息进行扩展,得到对应的上下文表示;根据各所述输入信息及对应的上下文表示,建立问句生成模型;基于所述问句生成模型,根据当前用户的当前输入信息,确定所述当前输入信息对应的问句序列。本发明通过历史参考数据建立问句生成模型;能够基于所述问句生成模型,可根据当前用户给定的少量当前输入信息,即可准确确定所述当前输入信息对应的问句序列。
-
公开(公告)号:CN106156082B
公开(公告)日:2019-09-20
申请号:CN201510150011.2
申请日:2015-03-31
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
Abstract: 本发明公开了一种本体对齐方法及装置,方法为,结合待对齐本体名称,待对齐本体的属性信息,待对齐本体的类别标签,分别计算待对齐本体与每一个候选本体之间的相似度;根据计算得到的相似度,获取每一个查找到的候选本体的综合评分;从所有综合评分中选取综合评分大于或等于预设综合评分阈值,且综合评分最高的候选本体;将待对齐本体与选取的候选本体进行对齐。采用本发明技术方案,在对本体进行对齐的过程中,除考虑本体名称之外,还综合考虑本体的属性信息和类别标签,避免了仅根据本体名称进行本体对齐所造成的对齐结果不准确的问题,保证了本体对齐的准确性,降低了本体对齐的错误率。
-
公开(公告)号:CN110209816A
公开(公告)日:2019-09-06
申请号:CN201910440322.0
申请日:2019-05-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明属于自然语言处理领域,具体涉及了一种基于对抗模仿学习的事件识别及分类方法、系统、装置,旨在解决传统事件识别及分类方法语言处理工具存在错误累计导致事件识别准确率低的问题。本发明方法包括:获取不含标准标注信息的句子并输入;将每一个词特征化后的词向量集构成词向量特征矩阵;采用向量编码器对词向量特征矩阵进行编码,并采用注意力机制为每一个词分配权重,获得知识向量;采用事件类型分类器依据知识向量计算输入信息属于各事件类别的概率;概率值最高的事件类别作为输入信息的事件类别。本发明不依赖自然语言处理工具对信息进行抽取,避免错误积累,提高了事件识别的准确率。
-
-
-
-
-
-
-
-
-