一种融合用户类别标签的相似问题检索方法及装置

    公开(公告)号:CN103218436B

    公开(公告)日:2016-05-18

    申请号:CN201310133077.1

    申请日:2013-04-17

    Inventor: 周光有 赵军

    Abstract: 本发明公开了一种融合用户类别标签的相似问题检索方法及其装置,所述包括:步骤1、计算每个用户类别标签之间的相似度;步骤2、根据用户输入的查询问题,建立融合用户类别标签的检索模型;步骤3、根据所述融合用户类别标签的检索模型,在所述查询问题对应的查询问题类别标签和相似类别标签下的历史问题中进行检索,获得所述查询问题的相似问题。因此,最终的相似问题检索仅仅考虑与查询问题在类别标签上相似或相近的历史问题,大大减少了搜索的空间以及主题不相关历史问题的干扰,有效地提高了检索的效率和性能。经过实验证明,在大规模的社区问答数据集中,相似问题检索的效率提高了81.77倍,检索的性能提升了11.25%。

    利用了网络搜索的依存句法的领域自适应方法

    公开(公告)号:CN103646112A

    公开(公告)日:2014-03-19

    申请号:CN201310729563.X

    申请日:2013-12-26

    Inventor: 周光有 赵军

    CPC classification number: G06F17/271 G06F17/30861

    Abstract: 一种利用了网络搜索的依存句法领域自适应方法,包括:构建基于K-Best的候选依存句法树重排序模型,用一个基准模型来产生一组候选依存句法分析树,其中,每一个候选依存句法分析树对应一个概率,从而定义了多个依存句法分析结果的初始序列,在此序列的基础上,重排序模型试图利用目标领域新增的句法特征来改进初始的句法树序列;进行基于网络搜索的候选依存句法树的词语依存关系评估,首先需要将一棵依存句法树拆分为一组词语关系的集合,对于集合中的每一个词语语义关系,利用网络搜索,分别计算该词语语义关系的强度,然后根据词语关系的权重来确定其评估值。经过实验证明,在宾州中文树库上训练的依存句法器,在生物医学数据上也表现出了良好的性能。

    一种汉英反向音译方法及装置

    公开(公告)号:CN101593173B

    公开(公告)日:2011-08-10

    申请号:CN200810113294.3

    申请日:2008-05-28

    Inventor: 赵军 杨帆 邹波

    Abstract: 本发明涉及一种汉英反向音译的方法和装置,将待翻译的中文音译名转换成汉语拼音序列表示,借助统计音译模块来生成音译候选;通过修正模块将音译候选修正为真实的英文单词,修正模块借助从大规模的网页上搜集的真实英文单词构成的词汇表;使用修正过的真实英文单词作为查询来验证翻译结果,利用搜索引擎得到的网页资源对修正后的音译候选进行重排序,对网页上以命名实体角色出现的词给予更高的评分,从而滤掉普通的英文单词。该方法能够克服统计模型在音译过程中丢失不发音音节和选择错误的相同发音音节等问题,有效地提高了音译的精确率。经过实验证明,在开放测试中,音译的精确率提高了17.55%。

    一种基于大模型的人物知识图谱复杂问答推理的智能体方法

    公开(公告)号:CN119513330A

    公开(公告)日:2025-02-25

    申请号:CN202411695690.7

    申请日:2024-11-25

    Abstract: 本发明公开了一种基于大模型的人物知识图谱复杂问答推理的智能体方法。该方法包括:基于多种召回方式,根据待回答问题动态匹配对应的提示示例,所述多种召回方式包括嵌入向量相似度匹配、字符串模糊匹配、融合匹配的任一种;采用少样本提示的方式,利用大语言模型进行待回答问题的关键实体识别、关系筛选、多候选实体递归搜索,获得待回答问题的各子问题的待选实体集;基于待选实体集,利用大语言模型以智能体的方式迭代生成思考、行动,并通过与知识图谱交互得到的观察结果,多轮交互后得到最终的答案。本发明以高质量的提示增强大语言模型的推理能力。

    针对大型语言模型的毒性思维链分析和优化方法及装置

    公开(公告)号:CN119476482A

    公开(公告)日:2025-02-18

    申请号:CN202411521465.1

    申请日:2024-10-29

    Abstract: 本发明提供一种针对大型语言模型的毒性思维链分析和优化方法及装置,方法包括:获取问题文本输入到大语言模型进行文本问答;通过归因追踪分析生成毒性思维链时存在的推理漂移信息损失,或者通过因果追踪分析根据毒性思维链生成回答文本时存在的回答偏移信息损失;当分析出存在推理漂移信息损失时,对毒性思维链进行残差解码得到优化思维链,当分析出存在回答漂移信息损失时,在思维链文本片段中,将问题文本与毒性思维链进行文本序列位置交换,得到优化文本序列,以使大语言模型基于优化思维链或优化文本序列,生成回答文本。通过本申请,克服在问答场景中,大语言模型毒性思维链的优化方法不能普遍适应,导致推理性能低下的缺陷。

    对齐增强语义解析方法、装置和计算机程序产品

    公开(公告)号:CN115062603B

    公开(公告)日:2024-11-29

    申请号:CN202210557374.8

    申请日:2022-05-20

    Abstract: 本发明涉及自然语言处理技术领域,提供一种对齐增强语义解析方法、装置和计算机程序产品,所述方法包括:预测知识问答任务中对应对齐关系的短语,并基于对应对齐关系的短语的类型生成对应的查询片段,其中,对齐关系包括短语和对应的查询片段;将序列化的对齐关系拼接至输入序列,并将输入序列输入编码器‑解码器解析模型的编码器模型,获取对齐的编码结果;将对齐的编码结果进行注意力操作并输入编码器‑解码器解析模型的解码器模型,解析并输出对齐关系对应的查询语句,其中,解码器模型是利用含噪对齐训练获得。本发明可实现较大粒度的建模对齐,且提高解析准确度及噪声对解析模型的鲁棒性。

    多跳问答方法、装置、设备及介质

    公开(公告)号:CN118709776A

    公开(公告)日:2024-09-27

    申请号:CN202410611393.3

    申请日:2024-05-16

    Abstract: 本发明提供一种多跳问答方法、装置、设备及介质,涉及计算机技术领域,该方法包括:将目标问题的当前交互记录信息和目标问题输入至分解模型,得到当前交互决策信息;在当前交互决策信息中包括目标问题中的当前交互子问题的情况下,根据当前交互子问题和当前交互子问题的知识信息,确定目标输入信息,并将目标输入信息输入至响应模型,得到响应模型输出的当前交互子问题的答案预测信息;将当前交互子问题的答案预测信息增加至当前交互记录信息中,得到下一交互记录信息,继续将下一交互记录信息和目标问题输入至分解模型,直到分解模型输出的下一交互决策信息中包括目标问题的答案预测信息。本发明实现提高了多跳问答准确性和效率。

    基于知识筛选的常识推理模型的训练方法、装置

    公开(公告)号:CN118643899A

    公开(公告)日:2024-09-13

    申请号:CN202410682396.6

    申请日:2024-05-29

    Abstract: 本发明提供一种基于知识筛选的常识推理模型的训练方法、装置,该方法包括:获取样本问答对;基于初始常识推理模型对样本问答对的初始背景知识进行筛选得到优选背景知识;基于优选背景知识、样本问题以及初始常识推理模型,确定样本问题的推理答案;基于样本问题的推理答案以及样本答案进行训练迭代,以得到基于知识筛选的常识推理模型;初始常识推理模型是基于构建第一约束和第二约束,并对第一约束和第二约束进行变分估计确定约束上界得到的;第一约束用于最大化优选背景知识与样本问答对之间的关联;第二约束用于最小化优选背景知识与初始背景知识之间的关联。本发明提供的方法,实现精准有效的知识筛选,提升模型推理的准确性和推理速度。

    基于想象增强的问答交互模型训练、问答交互方法及装置

    公开(公告)号:CN118551009A

    公开(公告)日:2024-08-27

    申请号:CN202410626490.X

    申请日:2024-05-20

    Abstract: 本发明提供一种基于想象增强的问答交互模型训练、问答交互方法及装置,所述方法包括:基于检索文本的压缩文本,对大语言模型进行微调,并基于微调后的大语言模型生成问题文本对应的虚拟文本,检索文本是问题文本的增强文本;将问题文本以及虚拟文本输入至学生模型,得到学生模型输出的问题文本的学生答案文本,学生模型的注意力层中添加有适配器,适配器的权重是将问题文本输入至元学习网络后确定的;基于学生答案文本与教师答案文本之间的差异,对学生模型进行蒸馏训练,得到问答交互模型;教师文本是将问题文本输入至学生模型对应的教师模型后生成的。本发明训练得到的问答交互模型能够高效且准确进行问答交互。

    端到端概念体系构建方法及系统
    60.
    发明公开

    公开(公告)号:CN117313738A

    公开(公告)日:2023-12-29

    申请号:CN202311094760.9

    申请日:2023-08-28

    Abstract: 本发明提供一种端到端概念体系构建方法及系统,方法包括:将待构建概念集合包括的第一词语对中的任一词语添加到初始概念体系中,所述第一词语对为从所述待构建概念集合包括的词语对之间上下位关系所对应的第一概率分布中,得到的概率最大的词语对;执行至少一次第一处理过程,直至所述待构建概念集合为空为止,根据更新后的初始概念体系,获取所述待构建概念集合对应的概念体系。所述系统执行所述方法。本发明基于词语对之间上下位关系的概率分布,每次选择概率最大的特定词语对添加到概念体系中,构建待构建概念集合的概念体系,能够更为准确的表征待构建概念集合中词语之间的语义特征。

Patent Agency Ranking