面向集成学习的大模型微调下的问答方法及装置

    公开(公告)号:CN118761459A

    公开(公告)日:2024-10-11

    申请号:CN202410740134.0

    申请日:2024-06-07

    Abstract: 本发明提供一种面向集成学习的大语言模型微调下的问答方法及装置,该方法包括:对LLMs模型进行预训练得到基准LLMs模型;基于集成学习策略对奖励模型进行训练,得到集成奖励模型;基于强化学习策略根据所述集成奖励模型输出的奖励分数对所述基准LLMs模型进行微调,得到目标LLMs模型;将用户的问题输入目标LLMs模型,得到所述问题的答案。本发明通过融合基于集成学习策略的奖励模型和基于人类反馈的强化学习技术,以实现对人类偏好的精准对齐,提高LLMs在特定领域的性能。

    基于多模态工业大模型的问答方法及装置

    公开(公告)号:CN118761458A

    公开(公告)日:2024-10-11

    申请号:CN202410740133.6

    申请日:2024-06-07

    Abstract: 本发明提供一种基于多模态工业大模型的问答方法及装置,该方法包括:从工业环境中收集多种模态的数据,使用各种模态对应的特征提取算法进行数据特征提取;使用对齐算法将各种模态的特征向量对齐,将各种模态对齐后的特征向量进行拼接,根据拼接后得到的综合特征向量构建知识库;对用户至少一种模态的问题输入进行特征提取得到问题输入的特征向量,将问题输入的特征向量对齐后进行拼接,得到查询特征向量;计算查询特征向量与知识库中的综合特征向量之间的相似度,根据相似度从知识库中查询与查询特征向量相关的综合特征向量,使用LLM根据查询的综合特征向量生成问题输入的答案。本发明实现基于多模态工业大模型的问答。

Patent Agency Ranking