-
公开(公告)号:CN116628145A
公开(公告)日:2023-08-22
申请号:CN202310301776.6
申请日:2023-03-27
Applicant: 北京理工大学
IPC: G06F16/332 , G06F16/35 , G06F18/10 , G06F18/214 , G06F18/2415 , G06N3/0455 , G06N3/047 , G06N3/082
Abstract: 本发明涉及一种基于弃权的抗标签噪声的对话状态追踪方法,属于自然语言处理技术领域。本方法对数据集中的每条数据,采用预训练模型编码,通过基于弃权的槽位分类器判断槽位的预测方式,对于需要生成的槽位使用槽值生成器解码,需要推理的槽位使用槽值复制器解码。在槽位分类器中添加了一个特殊类别“弃权”,表示模型认为本次预测过于复杂或存在标签噪声,并放弃对该样本的预测和学习,通过修正后的损失函数来训练抗标签噪声的对话状态追踪模型。本方法提高了编码效和解码速度,有效降低了标注错误的影响,使模型在标签噪声较大的数据集中也可以保持较好的性能。