-
公开(公告)号:CN117095083B
公开(公告)日:2024-03-15
申请号:CN202311341907.X
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06T11/60 , G06T5/70 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种文本‑图像生成方法、系统、装置和存储介质,属于深度学习、强化学习和计算机视觉等技术领域。其中方法包括:训练一个根据文本生成图像的模型作为基座模型;构建符合人类偏好的美学数据集、真实性数据集以及无毒性数据集;根据构建获得的数据集训练人类偏好奖励模型,该人类偏好奖励模型包括三个结构相同的评估器:美学评估器、真实性评估器和无毒性评估器;根据近端策略优化算法和人类偏好奖励模型,对基座模型进行微调,以获得符合人类偏好的文本‑图像生成模型。本发明通过利用人类偏好的反馈,采用强化学习来进一步微调文本‑图像生成模型,以确保根据文本生成的图像在美学、真实性和无毒性三个方面符合人类的偏好。
-
公开(公告)号:CN119623510A
公开(公告)日:2025-03-14
申请号:CN202411574116.6
申请日:2024-11-06
Applicant: 超级机器人研究院(黄埔) , 华南理工大学
Abstract: 本发明公开了一种多设备协同的高效在线适应方法,包括:针对算力资源丰富的设备,采用基于前向和反向传播的在线协同适应模式对设备中的第一模型进行处理:在检测到域偏移时,动态将模型所学权重保存到共享知识库;通过在第一模型参数中引入新参数矩阵,以在适应过程中捕捉新知识;针对低算力的设备,采用仅利用前向传播的在线协同适应模式对设备中的第二模型进行处理:模型直接利用已有的共享知识库进行在线适应。本发明通过采用动态更新地共享知识库,实现多设备间知识的累积、共享与动态利用;针对不同算力的设备,采用不同的在线协同适应模式来处理,极大地提升了在线适应在现实应用中的能效与实用性。本发明可广泛应用于迁移学习技术领域。
-
公开(公告)号:CN117095083A
公开(公告)日:2023-11-21
申请号:CN202311341907.X
申请日:2023-10-17
Applicant: 华南理工大学
IPC: G06T11/60 , G06T5/00 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种文本‑图像生成方法、系统、装置和存储介质,属于深度学习、强化学习和计算机视觉等技术领域。其中方法包括:训练一个根据文本生成图像的模型作为基座模型;构建符合人类偏好的美学数据集、真实性数据集以及无毒性数据集;根据构建获得的数据集训练人类偏好奖励模型,该人类偏好奖励模型包括三个结构相同的评估器:美学评估器、真实性评估器和无毒性评估器;根据近端策略优化算法和人类偏好奖励模型,对基座模型进行微调,以获得符合人类偏好的文本‑图像生成模型。本发明通过利用人类偏好的反馈,采用强化学习来进一步微调文本‑图像生成模型,以确保根据文本生成的图像在美学、真实性和无毒性三个方面符合人类的偏好。
-
-