-
公开(公告)号:CN116010577A
公开(公告)日:2023-04-25
申请号:CN202310061497.7
申请日:2023-01-20
Applicant: 清华大学深圳国际研究生院
IPC: G06F16/332 , G06F18/214 , G06N3/092 , G06N3/09 , G06N3/084 , G06N3/0985 , G06N7/01
Abstract: 本发明公开了一种联合进化更新的任务型对话方法及系统,所述方法包括如下步骤:A1:使用公开数据集得到训练集数据;A2:使用所述训练集数据构建预训练语言模型输入序列数据;A3:根据所述预训练语言模型输入序列数据得到用户模拟器和对话系统;A4:根据所述用户模拟器和对话系统得到在线对话数据池,基于在线强化学习对所述在线对话数据池进行优化,并联合更新用户模拟器和对话系统。本发明能够实现通过不断优化在线对话数据池中数据以获得高质量的对话数据池,为在线数据收集构建了高质量的循环,从而得到更优的用户模拟器和对话系统,提升整体的对话成功率。
-
公开(公告)号:CN115238051A
公开(公告)日:2022-10-25
申请号:CN202210794902.1
申请日:2022-07-05
Applicant: 清华大学深圳国际研究生院
IPC: G06F16/332 , G06F16/338 , G06F40/35 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种端到端任务型对话方法及系统,其是基于自注意力机制而构建,所述方法包括如下步骤:S1、构建用户模拟器,利用预训练语言模型来根据对话目标实现对应的自然语言理解、策略动作、自然语言生成功能;S2、构建对话系统,利用预训练语言模型来实现对应的信念状态跟踪、策略动作、自然语言生成功能;S3、构建任务型对话系统框架,并联合更新用户模拟器和系统,从而达到较高的对话成功率。本发明能够有效地构建端到端的用户模拟器和对话系统,同时可以实现较高的用户模拟器和系统的对话成功率。
-