-
公开(公告)号:CN119996853A
公开(公告)日:2025-05-13
申请号:CN202510105755.6
申请日:2025-01-23
Applicant: 厦门大学
IPC: H04N23/95 , H04N5/262 , H04N21/854
Abstract: 本发明公开一种无需训练、无需显示修复的带有相机控制的视频生成方法,使得普通基座模型也能具备相机控制能力,该方法在潜在空间中操作,无需额外的修复模型和深度估计模型,实现了简洁轻量化。该视频生成方法在去噪过程中的特定时间步#imgabs0#对每一帧的潜在变量执行重排列操作;通过改变潜在变量的排列顺序模拟特定的摄像机动作;随后,在潜在空间中应用了重采样策略对新视角区域进行填充,同时结合跨帧融合对齐策略,确保采样过程在帧与帧之间保持一致性;引入了一种噪声重注入机制,通过在去噪后期将噪声重新注入潜在变量中,延长去噪时间,缓解因重排列、重采样而造成的分布偏移现象,有效提高了视频生成质量。
-
公开(公告)号:CN119180955A
公开(公告)日:2024-12-24
申请号:CN202411224391.5
申请日:2024-09-03
Applicant: 厦门大学
IPC: G06V10/26 , G06N5/04 , G06N3/0464 , G06N3/048 , G06V10/80 , G06N3/09 , G06V10/82 , G06V10/40 , G06T7/00
Abstract: 本发明公开一种基于细节和语义深监督的医学影像分割方法、电子设备和存储介质,解决现有技术中存在的问题,保证低级特征与高级特征监督的同步融合,以便产生更可靠的分割结果。本发明包括以下具体步骤:步骤1、对于输入深监督神经网络的医学影像,提取其低级特征#imgabs0#和高级特征#imgabs1#,并输入细节增强模块和语义增强模块中进行解码以产生监督信号;步骤2、在训练阶段,进行每个监督信号的优化;步骤3、在推理过程,对所有的监督信号进行累加,得到最终的分割结果。
-