-
公开(公告)号:CN117095083B
公开(公告)日:2024-03-15
申请号:CN202311341907.X
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06T11/60 , G06T5/70 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种文本‑图像生成方法、系统、装置和存储介质,属于深度学习、强化学习和计算机视觉等技术领域。其中方法包括:训练一个根据文本生成图像的模型作为基座模型;构建符合人类偏好的美学数据集、真实性数据集以及无毒性数据集;根据构建获得的数据集训练人类偏好奖励模型,该人类偏好奖励模型包括三个结构相同的评估器:美学评估器、真实性评估器和无毒性评估器;根据近端策略优化算法和人类偏好奖励模型,对基座模型进行微调,以获得符合人类偏好的文本‑图像生成模型。本发明通过利用人类偏好的反馈,采用强化学习来进一步微调文本‑图像生成模型,以确保根据文本生成的图像在美学、真实性和无毒性三个方面符合人类的偏好。
-
公开(公告)号:CN119940407A
公开(公告)日:2025-05-06
申请号:CN202411848000.7
申请日:2024-12-16
Applicant: 超级机器人研究院(黄埔) , 华南理工大学
IPC: G06N3/045 , G06N3/09 , G06N3/006 , G06F16/3329
Abstract: 本发明公开了一种主动聊天机器人构建方法、装置、设备及介质,其中方法包括:构建以用户为中心的聊天质量评估器,用于评估聊天机器人对用户背景信息、聊天偏好的主动感知能力;构建用户背景数据集,用来让大模型扮演不同背景身份的用户智能体,和聊天机器人展开多轮对话聊天;对话语料收集与迭代课程学习,用来生成高质量对话语料,并使用迭代课程学习的方法微调聊天机器人对应的大模型,以提升模型对用户背景信息、聊天偏好的主动感知能力。本发明能够让聊天机器人主动关注用户的背景信息和聊天兴趣,给出符合用户聊天偏好的回答,从而提升用户的对话参与度与满意度,改进人机交互体验。本发明可广泛应用于人工智能技术领域。
-
公开(公告)号:CN117095083A
公开(公告)日:2023-11-21
申请号:CN202311341907.X
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06T11/60 , G06T5/00 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种文本‑图像生成方法、系统、装置和存储介质,属于深度学习、强化学习和计算机视觉等技术领域。其中方法包括:训练一个根据文本生成图像的模型作为基座模型;构建符合人类偏好的美学数据集、真实性数据集以及无毒性数据集;根据构建获得的数据集训练人类偏好奖励模型,该人类偏好奖励模型包括三个结构相同的评估器:美学评估器、真实性评估器和无毒性评估器;根据近端策略优化算法和人类偏好奖励模型,对基座模型进行微调,以获得符合人类偏好的文本‑图像生成模型。本发明通过利用人类偏好的反馈,采用强化学习来进一步微调文本‑图像生成模型,以确保根据文本生成的图像在美学、真实性和无毒性三个方面符合人类的偏好。
-
-