基于排序约束的文本生成模型的迁移训练方法和装置

    公开(公告)号:CN119358634A

    公开(公告)日:2025-01-24

    申请号:CN202411143033.1

    申请日:2024-08-20

    Abstract: 本发明提供一种基于排序约束的文本生成模型的迁移训练方法和装置,应用于自然语言处理技术领域。该方法包括:获取训练数据;将所述训练数据输入第一文本生成模型得到所述第一文本生成模型对答复文本的每个预测位置上的第一预测分布输出;将所述训练数据输入第二文本生成模型得到所述第二文本生成模型对答复文本的每个预测位置上的第二预测分布输出;计算所述第一预测分布输出和所述第二预测分布输出之间的排序损失和蒸馏损失;将所述排序损失和所述蒸馏损失融合得到混合损失,并将所有预测位置上的混合损失的均值作为总损失;基于所述总损失进行反向传播,以更新所述第二文本生成模型的模型参数。

    面向多任务对话的大语言模型训练方法和交互方法

    公开(公告)号:CN116821290A

    公开(公告)日:2023-09-29

    申请号:CN202310638543.5

    申请日:2023-05-31

    Abstract: 本发明提供一种面向多任务对话的大语言模型训练方法和交互方法,其中面向多任务对话的大语言模型训练方法包括:获取通用对话数据和任务对话数据,并确定所述任务对话数据对应的任务类别和任务目标;基于所述通用对话数据,对初始大语言模型进行模型微调,得到第一大语言模型;基于所述任务类别和所述任务目标,对所述任务对话数据进行任务标注,得到目标对话数据;基于所述目标对话数据,对所述第一大语言模型进行模型微调,得到大语言模型,不仅在极大程度上保留了模型的闲聊交互能力,还最大限度的提升了模型的任务识别能力和任务执行能力,使其能够具备快速准确地识别任务类别和任务目标的能力,优化了模型性能。

Patent Agency Ranking