一种半监督单视角3D物体重建方法

    公开(公告)号:CN115578511A

    公开(公告)日:2023-01-06

    申请号:CN202211149378.9

    申请日:2022-09-21

    Applicant: 复旦大学

    Abstract: 本发明属于计算机视觉三维重建技术领域,具体为一种半监督单视角3D物体重建方法。本发明用少量的有标注的样本来训练神经网络,然后用训练好的神经网络为无标注的样本生成伪标签并指导无标注的样本训练,与之同时本发明提出了判别器为生成的伪标签质量打分,限制低质量伪标签对模型训练的偏置。此外本发明提出基于注意力机制的原型形状先验模块,作为一个跨越图像和3D形状的桥梁,减小两个模态之间的差异,同时为神经网络提供形状先验,保证重建的3D形状符合自然。相比于当前业内的主流方法,本发明在标注数据量很小的情况下,对于单张图像的三维重建效果更精确,生成的3D形状也更真实自然。

    一种基于结构-外观信息融合的可控视频编辑方法

    公开(公告)号:CN120017907A

    公开(公告)日:2025-05-16

    申请号:CN202510083547.0

    申请日:2025-01-20

    Applicant: 复旦大学

    Abstract: 本发明涉及计算机视觉领域,具体公开了一种基于结构‑外观信息融合的可控视频编辑方法。引入ControlNet作为结构条件控制网络,从输入视频中提取并注入各种结构信息,随后,引入了一个外观条件控制网络,用于结合一张用户编辑之后的图像作为视频编辑过程中的外观控制信息,基于AnimateDiff搭建视频编辑主框架,对多尺度的结构信息特征图以及多尺度的外观信息特征图进行融合,并且结合输入的文本信息,生成编辑后的视频。与现有技术相比,本发明通过协调外观信息和结构信息,提供了一种灵活的编辑工具。用户可以结合预先训练的各种个性化文本‑图像生成模型,根据具体需求对视频进行编辑,生成多种风格、结构和外观的视频。

Patent Agency Ranking