-
公开(公告)号:CN113407660B
公开(公告)日:2021-12-14
申请号:CN202110934216.5
申请日:2021-08-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供非结构化文本事件抽取方法,包括:通过利用多阶句法树和图神经网络对文本信息进行编码,得到更为丰富和表征能力更强的词特征向量,进而提升事件检测的能力;通过构建外部本体知识,融入到候选事件论元编码环节,增加论元词汇特征编码的差异性,从而提升事件论元识别准确率。
-
公开(公告)号:CN113449084A
公开(公告)日:2021-09-28
申请号:CN202111021201.6
申请日:2021-09-01
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/35 , G06F40/279 , G06N3/04 , G06N3/08
Abstract: 本发明提供基于图卷积的关系抽取方法,包括:语言分析预处理:借助于自然语言分析工具将数据集中的原句进行分词和依存句法分析,得到原句的分词结果,并构建得到一棵表示原句中词之间语义依存关系的依存句法树,根据依存句法树中节点间的拓扑关系生成邻接矩阵;查询词向量:通过查询词向量表可将原句的每个词转换为其对应的词向量,得到了原句的向量化表示;图卷积神经网络提取特征:将邻接矩阵和每个词的向量化表示输入图卷积网络中,学习得到特征表示;关系分类:将特征表示进行拼接后送入学习神经网络中得到最终表示,再根据特征表示获得实体对在各关系上的概率分布,预测概率最大的关系即是模型预测句子中主语实体和宾语实体存在的关系类型。
-
公开(公告)号:CN113297369A
公开(公告)日:2021-08-24
申请号:CN202110846067.7
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 本发明提供基于知识图谱子图检索的智能问答系统,包括:所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;利用知识图谱嵌入得到知识图谱中三元组的低维稠密向量表示;将得到的用户输入问句中的实体映射到知识图谱中,得到每个实体在知识图谱中对应的候选实体列表,选择起点实体,引入关系谓词,在知识图谱中检索与之相匹配的知识图谱子图,再引入实体和关系谓词继续检索,迭代至全部的实体和关系谓词都引入完毕,输出检索到的知识图谱子图;再利用知识图谱子图过滤将检索得到的知识图谱子图进行剪枝;最后,输出相应结果。
-
公开(公告)号:CN113032516A
公开(公告)日:2021-06-25
申请号:CN202110581624.7
申请日:2021-05-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/295 , G06K9/62
Abstract: 本发明提供基于近似本体匹配的知识图谱融合方法,包括:对待融合的知识图谱的集合进行初始化,构建倒排索引,依据所述倒排索引获取本体的共现情况,获取近似匹配本体,根据近似匹配本体提取候选实体对,在名称候选实体对集合和近似匹配本体集合中计算候选实体对在属性上的相似度,根据相似度向量的分量对候选实体初步判别,利用实体的文本特征对所述歧义实体和近义实体进行二次筛选;通过对于知识图谱的本体层进行粗筛,依据筛选结果对计算过程分块,达到缩减计算规模的目的。在各块内利用属性、名称、文本等特征计算实体相似度。
-
-
公开(公告)号:CN113297369B
公开(公告)日:2022-04-01
申请号:CN202110846067.7
申请日:2021-07-26
Applicant: 中国科学院自动化研究所
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 本发明提供基于知识图谱子图检索的智能问答系统,包括:所述问句处理模块识别用户输入问句中的实体,根据所述实体构建输入问句的句法依存树,得到实体之间的关系谓词;利用知识图谱嵌入得到知识图谱中三元组的低维稠密向量表示;将得到的用户输入问句中的实体映射到知识图谱中,得到每个实体在知识图谱中对应的候选实体列表,选择起点实体,引入关系谓词,在知识图谱中检索与之相匹配的知识图谱子图,再引入实体和关系谓词继续检索,迭代至全部的实体和关系谓词都引入完毕,输出检索到的知识图谱子图;再利用知识图谱子图过滤将检索得到的知识图谱子图进行剪枝;最后,输出相应结果。
-
公开(公告)号:CN113407660A
公开(公告)日:2021-09-17
申请号:CN202110934216.5
申请日:2021-08-16
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/33 , G06F16/335 , G06F16/35 , G06F40/14 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明提供非结构化文本事件抽取方法,包括:通过利用多阶句法树和图神经网络对文本信息进行编码,得到更为丰富和表征能力更强的词特征向量,进而提升事件检测的能力;通过构建外部本体知识,融入到候选事件论元编码环节,增加论元词汇特征编码的差异性,从而提升事件论元识别准确率。
-
公开(公告)号:CN113032516B
公开(公告)日:2021-08-31
申请号:CN202110581624.7
申请日:2021-05-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/31 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/295 , G06K9/62
Abstract: 本发明提供基于近似本体匹配的知识图谱融合方法,包括:对待融合的知识图谱的集合进行初始化,构建倒排索引,依据所述倒排索引获取本体的共现情况,获取近似匹配本体,根据近似匹配本体提取候选实体对,在名称候选实体对集合和近似匹配本体集合中计算候选实体对在属性上的相似度,根据相似度向量的分量对候选实体初步判别,利用实体的文本特征对所述歧义实体和近义实体进行二次筛选;通过对于知识图谱的本体层进行粗筛,依据筛选结果对计算过程分块,达到缩减计算规模的目的。在各块内利用属性、名称、文本等特征计算实体相似度。
-
公开(公告)号:CN112668342A
公开(公告)日:2021-04-16
申请号:CN202110024800.7
申请日:2021-01-08
Applicant: 中国科学院自动化研究所
Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统,旨在旨在降低远程监督回标训练数据的噪声影响,同时减少训练数据损失的情况。该系统包括:文本分析模块,关系选择器训练模块,关系选择模块,噪声数据聚类模块,关系分类模块;所述文本分析模块用于接收远程监督回标文本数据,输出初始候选数据和初始高可信度数据;所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器;所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择,输出噪声数据和新增高可信度数据;所述噪声聚类模块用于对噪声数据进行聚类分析,输出新增候选数据,所述关系分类模块用于输出最后的分类结果。
-
-
-
-
-
-
-
-