-
公开(公告)号:CN112989016A
公开(公告)日:2021-06-18
申请号:CN202110532470.2
申请日:2021-05-17
Applicant: 南湖实验室
IPC: G06F16/332 , G06F16/36 , G06N3/00 , G06N20/00
Abstract: 本发明提供了一种用于检测对话策略学习中模拟用户经验质量的方法和系统,其方法包括以下步骤:S1.由世界模型生成模拟经验;S2.通过基于KL散度的质量检测器对所述的模拟经验进行质量检测;S3.将质量检测合格的模拟经验进行保存以用于对话策略模型训练。本方案引入了基于KL散度的质量检测器,能够更轻松有效地评估模拟经验的质量,并在确保对话策略的鲁棒性和有效性的同时大大提高计算效率,实现有效控制模拟经验质量的目的。
-