一种生成式对话状态追踪模型的实现方法及装置

    公开(公告)号:CN114841069A

    公开(公告)日:2022-08-02

    申请号:CN202210509258.9

    申请日:2022-05-11

    Applicant: 南京大学

    Inventor: 瞿裕忠 彭德家

    Abstract: 一种生成式对话状态追踪模型的实现方法及装置,对对话状态追踪构建生成模型,包括两个子任务,(1)针对槽位信息多标签分类,将对话语句输入到编码器获得对话的表示,再输入多标签分类模块获得每个槽位对应的logitmc;(2)生成对话状态任务,同时将对话的表示,输入到对话状态的解码器使用束搜索方式生成对话状态对应的logitgen;训练生成模型时将logitmc分别与正确的槽位分类结果计算二元交叉熵损失、logitgen和对话状态结果计算交叉熵损失,将二元交叉熵损失和交叉熵损失结合起来对生成模型进行训练优化。本发明使用单数据集训练即可,提高了对话状态生成的准确率,且训练效率高,资源利用率高。

Patent Agency Ranking