对话策略模型训练及对话方法、装置、设备、存储介质和程序产品

    公开(公告)号:CN118821793A

    公开(公告)日:2024-10-22

    申请号:CN202410205191.9

    申请日:2024-02-23

    Abstract: 本实施例公开了一种对话策略模型训练以及对话方法、装置、设备、存储介质和程序产品,该对话策略模型训练方法包括:基于历史对话的数据集,获取训练数据;根据对话策略模型,确定每个历史预测结果的选取概率;根据每个历史预测结果的选取概率,确定在负样本中用于选择每个对话动作的第一阈值、以及在负样本中用于拒绝每个对话动作的第二阈值;负样本表示训练数据中与负反馈日志信息对应的数据,负反馈日志信息表示内容为不满意的用户日志反馈信息;根据第一阈值和第二阈值,对负样本中的对话动作进行筛选,得出筛选后的对话动作;根据筛选后的对话动作,确定负样本的训练损失;至少根据负样本的训练损失,调整对话策略模型的网络参数值。

    任务型对话模型训练方法、装置及设备

    公开(公告)号:CN118796987A

    公开(公告)日:2024-10-18

    申请号:CN202311246875.5

    申请日:2023-09-26

    Abstract: 本发明提供一种任务型对话模型训练方法、装置及设备。所述方法包括:根据历史对话训练集,构建关键词C对应的回复簇;所述回复簇包括多个以关键词C为意图‑槽的去词汇化回复;去词汇化回复根据历史对话训练集中的训练数据进行去词汇化处理后获得;对回复簇中的多个去词汇化回复分别在回复簇中进行采样,获得多个去词汇化回复分别对应的采样伪回复;将采样伪回复作为伪标签,回复簇中的多个去词汇化回复作为训练数据,对任务对话转述模型进行训练,获得任务回复模型。采用该方法,能够解决现有技术任务型对话系统,造成回复信息缺失以及需要额外标注,导致成本消耗和系统迁移性能差的问题。

Patent Agency Ranking