一种基于多帧唇部参考和唇部光流模块的说话人脸生成方法、系统、设备及介质

    公开(公告)号:CN119068526A

    公开(公告)日:2024-12-03

    申请号:CN202411134657.7

    申请日:2024-08-19

    Abstract: 本发明公开了一种基于多帧唇部参考和唇部光流模块的说话人脸生成方法、系统、设备及介质。本发明设计了一个基于唇部光流模块的对齐模型,以提供更为精确的对齐参考图像,提升生成唇部结果的精确度。同时,本发明设计了一个基于多帧参考唇部模块和音频感知交叉注意力模块的渲染模型,以生成更为逼真的人物特征与唇部细节。最后,本发明通过结合对齐模型与渲染模型,显著提升了生成人物的唇部质量,为生成高质量说话人脸图像提供了一种有效而稳定的解决方案。

    一种基于注意力机制的变形生成模型的方法

    公开(公告)号:CN119206045A

    公开(公告)日:2024-12-27

    申请号:CN202411116449.4

    申请日:2024-08-14

    Abstract: 本发明涉及三维建模技术领域,具体涉及一种基于注意力机制的变形生成模型的方法,采用如下步骤:S10:首先,准备一个包含任意大小和数量的三维模型数据集,三维模型数据集格式为.ply;对所有模型进行必要的预处理,相应的预处理文件通过符号距离函数来隐式地表示数据集,数据集的格式为.mat;S20:设计一个变形生成模型;S30:训练变形生成模型;S40:反复执行步骤S30,直至达到预设的迭代次数,默认为70轮;每轮遍历所有三维模型;在每一轮迭代结束时,保存模型的参数;它通过巧妙结合变形隐式场模型架构与自注意力模块,充分利用了注意力机制能够捕获全局上下文信息,使得模型能够更全面地建立模型位置之间的联系,从而消除噪声。

Patent Agency Ranking