基于增强拒绝采样训练的大语言模型对齐微调方法和系统

    公开(公告)号:CN117852616B

    公开(公告)日:2024-05-31

    申请号:CN202410229872.9

    申请日:2024-02-29

    Abstract: 本发明公开了一种基于增强拒绝采样训练的大语言模型对齐微调方法和系统,涉及人工智能技术领域,包括:基于有监督微调后的大语言模型,为预设指令请求文本生成N条响应文本;基于训练好的奖励模型对每条响应文本进行评估,得到奖励分数;将N条响应文本按照对应的奖励分数由高到低排序,并选取前k条响应文本组成目标样本集;基于预设加权函数,计算每条响应文本对应的数据权重;基于预设指令请求文本、目标样本集中的响应文本和数据权重构建加权微调数据集,并基于加权微调数据集对有监督微调后的大语言模型进行对齐微调,得到目标大语言模型。本发明缓解了现有技术存在的过拟合风险高、易受有噪奖励分数干扰的技术问题。

    基于增强拒绝采样训练的大语言模型对齐微调方法和系统

    公开(公告)号:CN117852616A

    公开(公告)日:2024-04-09

    申请号:CN202410229872.9

    申请日:2024-02-29

    Abstract: 本发明公开了一种基于增强拒绝采样训练的大语言模型对齐微调方法和系统,涉及人工智能技术领域,包括:基于有监督微调后的大语言模型,为预设指令请求文本生成N条响应文本;基于训练好的奖励模型对每条响应文本进行评估,得到奖励分数;将N条响应文本按照对应的奖励分数由高到低排序,并选取前k条响应文本组成目标样本集;基于预设加权函数,计算每条响应文本对应的数据权重;基于预设指令请求文本、目标样本集中的响应文本和数据权重构建加权微调数据集,并基于加权微调数据集对有监督微调后的大语言模型进行对齐微调,得到目标大语言模型。本发明缓解了现有技术存在的过拟合风险高、易受有噪奖励分数干扰的技术问题。

    一种基于思维链确定问题答案的方法和装置、电子设备

    公开(公告)号:CN117787421A

    公开(公告)日:2024-03-29

    申请号:CN202410201337.2

    申请日:2024-02-23

    Abstract: 本发明公开了一种基于思维链确定问题答案的方法和装置、电子设备,属于人工智能技术领域,所述方法包括:获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制所述模型按照所述第二求解计划中的每个步骤执行求解,直至完成最后一个步骤,得到目标答案。本申请提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。

    一种基于思维链确定问题答案的方法和装置、电子设备

    公开(公告)号:CN117787421B

    公开(公告)日:2024-05-31

    申请号:CN202410201337.2

    申请日:2024-02-23

    Abstract: 本发明公开了一种基于思维链确定问题答案的方法和装置、电子设备,属于人工智能技术领域,所述方法包括:获取待解答问题以及多个样本数据,其中,每个所述样本数据包括:一个问题和所述问题对应的第一求解计划;将所述待解答问题与多个所述样本数据进行拼接后输入模型,得到待解答问题对应的第二求解计划;控制所述模型按照所述第二求解计划中的每个步骤执行求解,直至完成最后一个步骤,得到目标答案。本申请提供的基于思维链确定问题答案的方案,既能够赋予思维链纠错能力,又可以人为或者模型自动干预对第二求解计划中的第一步骤进行修正。

    一种基于思维链的大模型安全防护方法

    公开(公告)号:CN119989408A

    公开(公告)日:2025-05-13

    申请号:CN202510062744.4

    申请日:2025-01-15

    Abstract: 本发明是一种基于思维链的大模型安全防护方法,适用于增强各类大语言模型的防御能力且无需额外的后训练开销。本发明涉及大模型安全防护技术领域,通过大语言模型安全防御系统提示词增强,确保生成安全的回复;基于零样本思维链的安全防御后缀,应对越狱攻击;通过计算越狱攻击成功率,来对大语言模型的安全性进行评估。本发明采用的基于思维链的大语言模型安全防护方法包含了安全系统提示词和零样本思维链两部分。本发明不引入额外的计算成本,而是充分利用大语言模型的推理能力来抵御越狱攻击,极大地增强了大语言模型的安全防护能力,确保大模型在不同应用场景下的稳定运行和安全使用。

    一种基于LoRA嵌入的指令数据挖掘方法和系统

    公开(公告)号:CN117556251B

    公开(公告)日:2025-03-18

    申请号:CN202311332989.1

    申请日:2023-10-16

    Abstract: 一种基于LoRA嵌入的指令数据挖掘方法和系统,涉及指令数据挖掘领域。解决了常见的通过模型生成的指令数据往往重复性较高,类似的指令数据反复出现,数据集同质化和冗余的情况较为普遍的问题。所述方法包括:采用LoRA的方式对ShareGPT数据集进行训练,获取所述ShareGPT数据集中指令数据的嵌入表示;通过UMAP算法对所述嵌入表示进行降维,获取每个指令在三维空间中的表示;根据最小化指令数据在三维空间中的密度对每个指令表示进行筛选,获取多样性增强的数据子集。本发明应用于人工神经网络训练领域。

    一种基于情感增强的语音大语言模型翻译强化方法

    公开(公告)号:CN119378574A

    公开(公告)日:2025-01-28

    申请号:CN202411408324.9

    申请日:2024-10-10

    Abstract: 一种基于情感增强的语音大语言模型翻译强化方法,涉及人工智能领域。解决现有技术中缺少如何高效地将语音模态信息融入到现有的大语言模型中,使其完成端到端的语音自动翻译任务。所述方法包括:收集包含多种情感表达的语音与文本对的多语言数据集,并进行预处理,构成原文语音与文本和译文语音与文本的多语言语料对;将多语言语料对的语音部分输入到语音大语言模型中,令语音大语言模型对其进行翻译;使用情感契合度打分模型对步骤2中的翻译结果进行评估,判断翻译结果中的语音情感与原文语音与文本的多语言语料对中的情感是否一致;使用打分模型为同一问题的不同结果进行打分,根据分数从高到低排序进行DPO算法,更新语音大语言模型的参数。

    一种基于思维链的跨语言多文档摘要评价方法

    公开(公告)号:CN118467719A

    公开(公告)日:2024-08-09

    申请号:CN202410663888.0

    申请日:2024-05-27

    Abstract: 本发明公开了一种基于思维链的跨语言多文档摘要评价方法,属于自然语言处理技术领域。解决了现有技术中传统的跨语言多文档摘要评价方法忽视生成摘要与原文之间的事实一致性导致的评价质量较低的问题;本发明提取给定的源语言文档集合中每个源语言文档的事实性关键信息,提取生成的跨语言多文档摘要中每个摘要的事实性关键信息;对源语言答案和目标语言答案进行平均度量,得到信息覆盖度得分;计算跨语言多文档摘要中提取的所有事实性关键信息即所有陈述的一致性得分的平均值,得到事实一致性分数;将信息覆盖度得分与事实一致性得分进行融合,得到综合评价分数。本发明有效提升了跨语言多文档摘要评价方法的精度和效率,可以应用于摘要评估。

    一种基于模型认知校验的多跳推理知识编辑方法

    公开(公告)号:CN118364912A

    公开(公告)日:2024-07-19

    申请号:CN202410482904.6

    申请日:2024-04-22

    Abstract: 本申请公开了一种基于模型认知校验的多跳推理知识编辑方法,属于知识编辑技术领域,包括:S100构建推理模型和文本相似性评估模型;S200获取多跳推理问题并拆解出单跳推理子问题,针对单跳推理子问题生成预设回答;S300通过文本相似性评估模型检索与单跳推理子问题相关的若干外部知识;S400计算预设回答的生成序列与模型认知的相关度,根据相关度从若干外部知识中筛选出目标外部知识,通过目标外部知识对生成的预设回答进行修正,并输出修正后的预设回答;S500判断是否完成多跳推理问题,若是,结束推理过程,否则,返回步骤S200。本申请提供的方法在多跳推理问答任务中多跳推理性能更强。

    基于语义空间共享的知识图谱问答系统

    公开(公告)号:CN111897944B

    公开(公告)日:2024-03-22

    申请号:CN202010827800.6

    申请日:2020-08-17

    Abstract: 基于语义空间共享的知识图谱问答系统,它属于中文知识图谱问答技术领域。本发明解决了现有知识图谱问答系统中各模块之间信息共享不足,导致获得的答案实体的准确率有限的问题。本发明利用问句主实体识别子模块,实体链接子模块和关系预测子模块的训练数据来联合训练BERT预训练语言模型,通过将联合训练好的模型嵌入各子模块,以实现语义空间的信息共享。通过本发明方法可以确保问句主实体识别子模块能够且只能从自然语言问句中识别出一个主实体,通过各子模块之间的语义信息共享,可以有效提高获得的答案实体的准确率。通过实验证明,采用本发明方法获得的答案实体的准确率可以达到86.64%。本发明可以应用于知识图谱问答。

Patent Agency Ranking