一种基于弃权的抗标签噪声的对话状态追踪方法

    公开(公告)号:CN116628145A

    公开(公告)日:2023-08-22

    申请号:CN202310301776.6

    申请日:2023-03-27

    Abstract: 本发明涉及一种基于弃权的抗标签噪声的对话状态追踪方法,属于自然语言处理技术领域。本方法对数据集中的每条数据,采用预训练模型编码,通过基于弃权的槽位分类器判断槽位的预测方式,对于需要生成的槽位使用槽值生成器解码,需要推理的槽位使用槽值复制器解码。在槽位分类器中添加了一个特殊类别“弃权”,表示模型认为本次预测过于复杂或存在标签噪声,并放弃对该样本的预测和学习,通过修正后的损失函数来训练抗标签噪声的对话状态追踪模型。本方法提高了编码效和解码速度,有效降低了标注错误的影响,使模型在标签噪声较大的数据集中也可以保持较好的性能。

Patent Agency Ranking