多轮对话模型的训练方法、装置、电子设备及存储介质

    公开(公告)号:CN119128105A

    公开(公告)日:2024-12-13

    申请号:CN202411284045.6

    申请日:2024-09-13

    Inventor: 徐启东 杨青

    Abstract: 本申请提供一种多轮对话模型的训练方法、装置、电子设备及存储介质,涉及人工智能技术领域。在本申请中,通过构建带有用于指示对应的样本对话语句是否需要改写的第一标签的样本对话训练集,对初始多轮对话模型进行迭代训练;这样避免了现有技术中无监督的方式判别当前对话语句是否需要改写,导致判别模型的判别准确性较低的问题。并且,由于初始多轮对话模型既可以判别当前对话语句是否需要改写,还可以在确定需要改写当前对话语句时,基于当前对话语句关联的至少一个历史对话语句对当前对话语句进行改写,实现了语句判别和语句改写的联合建模,也即针对初始多轮对话模型的判别和改写均进行了训练,从而提高了多轮对话模型的对话改写效果。

Patent Agency Ranking