-
公开(公告)号:CN119477671B
公开(公告)日:2025-04-15
申请号:CN202510052640.5
申请日:2025-01-14
Applicant: 南京信息工程大学
IPC: G06T3/04 , G06N3/0455 , G06N3/0464 , G06V40/10
Abstract: 本发明涉及计算机视觉技术领域,公开了一种人体与姿态变换图像生成方法及装置,包括以下步骤:利用编码器分别将源人体图像、目标人体图像、源姿态图像与目标姿态图像压缩到张量空间形成源人体张量、目标人体张量、源姿态张量与目标姿态张量;张量依次通过‘W’型迁移网络中若干功能模块,每个功能模块包含信息引入模块、权重图模块、张量对齐模块与注意力模块;利用训练好的两个‘W’网络,分别预测目标人体张量与目标姿态张量,再分别通过解码器得到预测的目标人体图像与目标姿态图像。本发明将同时完成人体与姿态变换任务,保证了生成的目标图像具有高质量纹理特征。
-
公开(公告)号:CN119477671A
公开(公告)日:2025-02-18
申请号:CN202510052640.5
申请日:2025-01-14
Applicant: 南京信息工程大学
IPC: G06T3/04 , G06N3/0455 , G06N3/0464 , G06V40/10
Abstract: 本发明涉及计算机视觉技术领域,公开了一种人体与姿态变换图像生成方法及装置,包括以下步骤:利用编码器分别将源人体图像、目标人体图像、源姿态图像与目标姿态图像压缩到张量空间形成源人体张量、目标人体张量、源姿态张量与目标姿态张量;张量依次通过‘W’型迁移网络中若干功能模块,每个功能模块包含信息引入模块、权重图模块、张量对齐模块与注意力模块;利用训练好的两个‘W’网络,分别预测目标人体张量与目标姿态张量,再分别通过解码器得到预测的目标人体图像与目标姿态图像。本发明将同时完成人体与姿态变换任务,保证了生成的目标图像具有高质量纹理特征。
-
公开(公告)号:CN119251357B
公开(公告)日:2025-03-25
申请号:CN202411788202.7
申请日:2024-12-06
Applicant: 南京信息工程大学
IPC: G06T11/60 , G06T11/00 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了计算机视觉领域的一种文本驱动的人体姿态与纹理编辑方法及装置。方法包括:首先从关于姿态信息的文本描述中提取特征,转换为骨架节点坐标并绘制成骨架图;再从服饰形状文本提取特征,结合骨架图通过编解码网络得到人体解析图;训练纹理感知的FSQ,学习不同纹理特征向量表示,将纹理文本描述与人体解析图输入FSQ进行采样,填充纹理并生成较粗糙但符合文本描述的人体图像。接着微调用于姿态迁移的扩散模型,用于对生成的人体图像质量进行进一步优化。该方法克服现有模型生成能力不稳定、对图像控制不足的问题,保证生成的人体图像逼真且与输入文本语义一致,为人体图像生成提供了新的有效途径。
-
公开(公告)号:CN119251357A
公开(公告)日:2025-01-03
申请号:CN202411788202.7
申请日:2024-12-06
Applicant: 南京信息工程大学
IPC: G06T11/60 , G06T11/00 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了计算机视觉领域的一种文本驱动的人体姿态与纹理编辑方法及装置。方法包括:首先从关于姿态信息的文本描述中提取特征,转换为骨架节点坐标并绘制成骨架图;再从服饰形状文本提取特征,结合骨架图通过编解码网络得到人体解析图;训练纹理感知的FSQ,学习不同纹理特征向量表示,将纹理文本描述与人体解析图输入FSQ进行采样,填充纹理并生成较粗糙但符合文本描述的人体图像。接着微调用于姿态迁移的扩散模型,用于对生成的人体图像质量进行进一步优化。该方法克服现有模型生成能力不稳定、对图像控制不足的问题,保证生成的人体图像逼真且与输入文本语义一致,为人体图像生成提供了新的有效途径。
-
-
-