-
公开(公告)号:CN106156082A
公开(公告)日:2016-11-23
申请号:CN201510150011.2
申请日:2015-03-31
Applicant: 华为技术有限公司 , 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种本体对齐方法及装置,方法为,结合待对齐本体名称,待对齐本体的属性信息,待对齐本体的类别标签,分别计算待对齐本体与每一个候选本体之间的相似度;根据计算得到的相似度,获取每一个查找到的候选本体的综合评分;从所有综合评分中选取综合评分大于或等于预设综合评分阈值,且综合评分最高的候选本体;将待对齐本体与选取的候选本体进行对齐。采用本发明技术方案,在对本体进行对齐的过程中,除考虑本体名称之外,还综合考虑本体的属性信息和类别标签,避免了仅根据本体名称进行本体对齐所造成的对齐结果不准确的问题,保证了本体对齐的准确性,降低了本体对齐的错误率。
-
公开(公告)号:CN104881399A
公开(公告)日:2015-09-02
申请号:CN201510250005.4
申请日:2015-05-15
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于概率软逻辑PSL的事件识别方法和系统,所述方法包括:计算至少候选与事件、以及至少在同一文档和/或同一语句中出现候选与主题、事件与主题、两个不同候选或两个不同事件中的至少任意一个的条件概率;在PSL模型中为不同条件概率分别设定对应的变量,设计并根据PSL模型的变量公式进行迭代,以最大化候选与事件的条件概率对应的变量,得到候选在最大化条件下对应的特定的事件,并构成事件识别模型。本发明所述方法能够提高事件识别的准确性。
-
公开(公告)号:CN104820694A
公开(公告)日:2015-08-05
申请号:CN201510208978.1
申请日:2015-04-28
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
CPC classification number: G06F17/30401 , G06F17/30557
Abstract: 本发明提供一种基于多知识库和整数线性规划ILP的自动问答方法和系统,所述方法包括:创建用于索引多个知识库的实体和/或关系的资源字典;在所述资源字典中查询并由自然语句的多个文本片段映射到的多个实体和/或多个关系构成多个候选资源;对各候选资源执行转换,获得对应的多个模板;将所述各文本片段、映射、候选资源、转换、和模板组合成消歧图;根据ILP对所述消歧图进行联合推理、选取至少一个待查询模板来生成规范查询语句。本发明所述方法能够对自然语句在多知识库中进行较精确的查询。
-
公开(公告)号:CN104572892A
公开(公告)日:2015-04-29
申请号:CN201410817856.8
申请日:2014-12-24
Applicant: 中国科学院自动化研究所
CPC classification number: G06F17/30707
Abstract: 本发明公开了一种基于循环卷积网络的文本分类方法,包括以下步骤:步骤1,利用双向循环网络对所有词进行上下文向量的表示;步骤2,将上下文向量及当前词的词向量组合成当前词的表示;步骤3,利用最大池化技术提取最重要的上下文信息得到文本表示;步骤4,利用文本表示进行文本分类。该方法能够较多地保留文本中的词序信息,捕捉长距离的文本依赖关系,精确刻画词的语义,并通过最大池化技术找到对文本分类影响最大的词和短语。有效地提高了文本分类的准确率。经过试验证明,本方法在多个文本分类数据集上平均提升1%。
-
公开(公告)号:CN103218436A
公开(公告)日:2013-07-24
申请号:CN201310133077.1
申请日:2013-04-17
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明公开了一种融合用户类别标签的相似问题检索方法及其装置,所述包括:步骤1、计算每个用户类别标签之间的相似度;步骤2、根据用户输入的查询问题,建立融合用户类别标签的检索模型;步骤3、根据所述融合用户类别标签的检索模型,在所述查询问题对应的查询问题类别标签和相似类别标签下的历史问题中进行检索,获得所述查询问题的相似问题。因此,最终的相似问题检索仅仅考虑与查询问题在类别标签上相似或相近的历史问题,大大减少了搜索的空间以及主题不相关历史问题的干扰,有效地提高了检索的效率和性能。经过实验证明,在大规模的社区问答数据集中,相似问题检索的效率提高了81.77倍,检索的性能提升了11.25%。
-
公开(公告)号:CN119558280A
公开(公告)日:2025-03-04
申请号:CN202411677572.3
申请日:2024-11-22
Applicant: 中国科学院自动化研究所
IPC: G06F40/16 , G06F40/253 , G06F40/268 , G06F40/166 , G06N3/0475 , G06N3/0455 , G06N3/09 , G06N3/047
Abstract: 本发明公开了一种基于词性评判的大语言模型事实增强解码方法。该方法包括以下主要步骤:对大型语言模型各层中的文本进行幻觉部分的词性分布分析,确定干预目标词性;基于干预目标词性,确定事实词汇与幻觉词汇在同一个句子中的输出概率趋势;构建针对不同干预目标词性的评判器,并基于事实词汇与幻觉词汇在同一个句子中的输出概率趋势对评判器进行训练;在大型语言模型生成文本的解码过程中,利用训练好的评判器实时监测模型输出,检测潜在的幻觉信号,根据检测到的幻觉信号,动态调整大型语言模型的事实文本生成过程中的选项。本发明与传统方法相比能够显著提高生成内容的事实准确性,且无需借助外部资源或模型。
-
公开(公告)号:CN117217312B
公开(公告)日:2025-02-28
申请号:CN202311085481.6
申请日:2023-08-25
Applicant: 中国科学院自动化研究所
IPC: G06N5/04 , G06N5/022 , G06N3/04 , G06F16/28 , G06F16/901
Abstract: 本发明提供一种基于图神经网络的可解释知识图谱推理方法及装置,该基于图神经网络的可解释知识图谱推理方法包括:获取用户输入的待查询三元组,待查询三元组包括源实体和实体关系;根据源实体在知识图谱中的上下文信息构建知识图谱子图,并根据关系感知的注意力机制对知识图谱子图和实体关系进行编码,得到关系权重;基于关系权重对源实体在知识图谱中关联的关系路径进行聚合处理,得到关系路径表征。本发明所述方法通过结合结构信息、实体关系对不同实体的贡献度,以及其在各种规则路径中的重要性对源实体的关系路径进行综合分析,充分利用知识图谱的上下文信息和周围邻居节点信息,提升了推理结果的准确率。
-
公开(公告)号:CN119443166A
公开(公告)日:2025-02-14
申请号:CN202411626024.8
申请日:2024-11-14
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出了提升小型语言模型复杂推理的神经符号协同蒸馏方法,包括:首先,从大型语言模型中提取一般推理能力和通用知识,将其蒸馏至参数化的SLMs中;其次,针对复杂推理任务所需的特定能力和罕见知识,采用符号知识蒸馏手段,将这些知识存储在符号知识库中。通过这种一般能力与特定能力的解耦,能够以较小的模型规模和成本实现高性能。此外,本发明还包含一种多任务学习方法,通过引入辅助任务如增强蒸馏、答案预测和直接推理提示,进一步提升SLMs对可能噪声知识的鲁棒性,并有效利用特定知识。本发明增强了小型语言模型处理复杂推理任务的能力,适用于对一般认知能力及专业领域知识都有需求的复杂推理场景。
-
公开(公告)号:CN119415223A
公开(公告)日:2025-02-11
申请号:CN202411278711.5
申请日:2024-09-12
Applicant: 中国科学院自动化研究所 , 昆明理工大学
Abstract: 本发明提供一种任务性能控制方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:基于因果追踪方法确定目标模型在执行上下文学习任务中的重点输入词;确定所述目标模型在执行推理过程中在所述重点输入词上的梯度变化;将梯度变化最大的预设数量的位置上的神经元确定为重点神经元;通过调整所述重点神经元的激活水平控制所述目标模型的任务性能。
-
公开(公告)号:CN118193750B
公开(公告)日:2024-12-27
申请号:CN202410312411.8
申请日:2024-03-19
Applicant: 中国科学院自动化研究所
IPC: G06F16/36 , G06N5/02 , G06N3/0442 , G06N3/0455 , G06N3/048 , G06F17/16 , G06F17/18 , G06F18/22 , G06N3/08
Abstract: 本发明提供一种知识图谱事实错误检测方法、装置、电子设备及存储介质,应用于数据处理技术领域。该方法包括:从待检测知识图谱中获取目标三元组,所述目标三元组包括头实体、尾实体以及实体关联关系;确定所述目标三元组的置信度分数,所述置信度分数包括局部分数和全局分数,所述局部分数用于指示所述目标三元组的内部结构的矛盾程度,所述全局分数用于指示所述头实体和所述尾实体在所述待检测知识图谱中的外部语义的差异程度;在所述置信度分数大于预设阈值的情况下,确定所述目标三元组存在事实错误。
-
-
-
-
-
-
-
-
-