-
公开(公告)号:CN115512368B
公开(公告)日:2024-05-10
申请号:CN202211007329.1
申请日:2022-08-22
Applicant: 华中农业大学
IPC: G06V30/41 , G06V30/19 , G06F40/126 , G06F40/30 , G06N3/0464 , G06N3/048 , G06N3/094
Abstract: 本发明提供了一种跨模态语义生成图像模型和方法,采用了深度学习领域的生成对抗网络技术,结合自然语言处理领域的Bert模型提取文本描述的特征向量作为图像生成的条件,从而生成符合文本描述的图像,实现了由文本描述产生图像的功能。本发明提出了自适应语义特征融合模块,通过跨模态的方式调整生成图像,将语义特征更好地融合到图像生成的过程中,更加有效地构建文本与图像之间的映射关系,使得生成图像更加贴合语义描述。本发明将对比学习的方法应用到跨模态语义图像生成研究中,提出基于对比学习的损失函数,通过其约束文本特征与图像特征之间的相关性增强最终生成图像与语义的一致性,极大提升了模型性能。
-
公开(公告)号:CN115512368A
公开(公告)日:2022-12-23
申请号:CN202211007329.1
申请日:2022-08-22
Applicant: 华中农业大学
Abstract: 本发明提供了一种跨模态语义生成图像模型和方法,采用了深度学习领域的生成对抗网络技术,结合自然语言处理领域的Bert模型提取文本描述的特征向量作为图像生成的条件,从而生成符合文本描述的图像,实现了由文本描述产生图像的功能。本发明提出了自适应语义特征融合模块,通过跨模态的方式调整生成图像,将语义特征更好地融合到图像生成的过程中,更加有效地构建文本与图像之间的映射关系,使得生成图像更加贴合语义描述。本发明将对比学习的方法应用到跨模态语义图像生成研究中,提出基于对比学习的损失函数,通过其约束文本特征与图像特征之间的相关性增强最终生成图像与语义的一致性,极大提升了模型性能。
-