-
公开(公告)号:CN114168804B
公开(公告)日:2022-06-10
申请号:CN202111550920.7
申请日:2021-12-17
Applicant: 中国科学院自动化研究所
IPC: G06F16/901 , G06F16/903 , G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明提出一种基于异质子图神经网络的相似信息检索方法和系统。其中,方法包括:首先,将业务场景数据面向异质图进行图结构化数据,即构建异质图;其次,设计了一种子图范式,据此设计异质子图神经网络,建模和学习中心节点的邻域信息,并在不需要交互记录等标签的低资源情况下进行模型训练,从而得到节点的嵌入表示;最后,设计了基于局部敏感哈希的快速相似度计算模块来实现对相似内容检索这一功能的在线服务。本发明能够解决了低资源场景下相似信息检索这一业务需求。
-
公开(公告)号:CN114297394A
公开(公告)日:2022-04-08
申请号:CN202210238820.9
申请日:2022-03-11
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种对文本中的事件论元进行抽取的方法和电子设备,该方法包括:对待处理文本中包含的事件类型进行检测,得到目标事件类型;根据该目标事件类型及对应的目标论元角色的先验关联信息,构造得到论元抽取问题;将待处理文本和论元抽取问题进行拼接,得到目标文本;将该目标文本的表示向量输入至机器阅读理解模型中,该模型包括两层依序设置的分类器,第一层分类器同步对该目标文本是否存在答案、对答案的开始位置和结束位置进行识别预测,得到携带有答案指示标签的位置预测结果;第二层分类器对开始位置和结束位置进行配对组合后的预测实体是否为事件论元进行预测,得到答案预测结果;根据该答案预测结果和对应的标签,输出事件论元。
-
公开(公告)号:CN113377930A
公开(公告)日:2021-09-10
申请号:CN202110931275.7
申请日:2021-08-13
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/36 , G06F40/216 , G06F40/242 , G06F40/295
Abstract: 本发明提供面向中文短文本的实体识别与实体链接方法,包括:使用知识库中的实体名称与实体别名信息去构建实体名称词典并识别出实体;将实体的描述文本输入到预训练语言模型中,得到实体的名称嵌入表示;将所述识别出的实体在原始短文本中的位置特征、原始短文本和所述实体的名称嵌入表示同时输入到融合知识库实体名嵌入的短文本实体识别模型中,得到当前实体是否为正确实体的概率;再与传统的实体识别模型融合,得到最终实体识别结果;利用给定的知识库构建实体指称项词典,并通过实体识别结果确定每一个待消歧实体的候选实体集合;将原始短文本和待消歧实体的描述文本连在一起,输入实体链接模型,得到正确的链接实体。
-
公开(公告)号:CN112633483A
公开(公告)日:2021-04-09
申请号:CN202110026128.5
申请日:2021-01-08
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种四元组门图神经网络事件预测方法、装置、设备及介质,旨在提高传统事件预测精度。所述方法包括:将多个初始背景事件与多个待选事件构成事理图谱;将事理图谱中的所有事件的向量以四元组的形式进行表示,得到初始背景事件向量与初始待选事件向量;使用四元组门图神经网络对事理图谱进行图网络计算,得到多个新的背景事件向量与多个新的待选事件向量;利用注意力神经网络对事件的向量进行计算,得到背景事件的整体向量;将整体向量与每个新的待选事件向量进行打分,将得分最高的一个待选事件向量对应的待选事件作为预测结果。
-
-
公开(公告)号:CN113297369B
公开(公告)日:2022-04-01
申请号:CN202110846067.7
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 本发明提供基于知识图谱子图检索的智能问答系统,包括:所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;利用知识图谱嵌入得到知识图谱中三元组的低维稠密向量表示;将得到的用户输入问句中的实体映射到知识图谱中,得到每个实体在知识图谱中对应的候选实体列表,选择起点实体,引入关系谓词,在知识图谱中检索与之相匹配的知识图谱子图,再引入实体和关系谓词继续检索,迭代至全部的实体和关系谓词都引入完毕,输出检索到的知识图谱子图;再利用知识图谱子图过滤将检索得到的知识图谱子图进行剪枝;最后,输出相应结果。
-
公开(公告)号:CN113407660A
公开(公告)日:2021-09-17
申请号:CN202110934216.5
申请日:2021-08-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供非结构化文本事件抽取方法,包括:通过利用多阶句法树和图神经网络对文本信息进行编码,得到更为丰富和表征能力更强的词特征向量,进而提升事件检测的能力;通过构建外部本体知识,融入到候选事件论元编码环节,增加论元词汇特征编码的差异性,从而提升事件论元识别准确率。
-
公开(公告)号:CN113032516B
公开(公告)日:2021-08-31
申请号:CN202110581624.7
申请日:2021-05-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/295 , G06K9/62
Abstract: 本发明提供基于近似本体匹配的知识图谱融合方法,包括:对待融合的知识图谱的集合进行初始化,构建倒排索引,依据所述倒排索引获取本体的共现情况,获取近似匹配本体,根据近似匹配本体提取候选实体对,在名称候选实体对集合和近似匹配本体集合中计算候选实体对在属性上的相似度,根据相似度向量的分量对候选实体初步判别,利用实体的文本特征对所述歧义实体和近义实体进行二次筛选;通过对于知识图谱的本体层进行粗筛,依据筛选结果对计算过程分块,达到缩减计算规模的目的。在各块内利用属性、名称、文本等特征计算实体相似度。
-
公开(公告)号:CN112668342A
公开(公告)日:2021-04-16
申请号:CN202110024800.7
申请日:2021-01-08
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统,旨在旨在降低远程监督回标训练数据的噪声影响,同时减少训练数据损失的情况。该系统包括:文本分析模块,关系选择器训练模块,关系选择模块,噪声数据聚类模块,关系分类模块;所述文本分析模块用于接收远程监督回标文本数据,输出初始候选数据和初始高可信度数据;所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器;所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择,输出噪声数据和新增高可信度数据;所述噪声聚类模块用于对噪声数据进行聚类分析,输出新增候选数据,所述关系分类模块用于输出最后的分类结果。
-
公开(公告)号:CN106095950A
公开(公告)日:2016-11-09
申请号:CN201610422829.X
申请日:2016-06-14
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种人机对话中教授意图答案生成方法,所述方法包括:对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图则进入下一步骤;在所述历史记录中寻找当前对话对应的问句;结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;对于相关答案集合进行过滤;基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果及当前对话的回答返回。本发明能够对人机对话中教授意图下对用户的教授内容进行良好的反馈,提高人机对话的满意度。
-
-
-
-
-
-
-
-
-