-
公开(公告)号:CN119323530A
公开(公告)日:2025-01-17
申请号:CN202411561972.8
申请日:2024-11-05
Applicant: 东北大学秦皇岛分校
IPC: G06T5/70 , G06N3/0475 , G06N3/048 , G06N3/0464 , G06N3/045 , G06V10/77 , G06V10/40
Abstract: 本发明提供基于噪声调度和加速采样的高效且稳定的生成模型,涉及人工智能生成模型技术领域。该基于噪声调度和加速采样的高效且稳定的生成模型,控制图像与扩散因子之间的分配比例,在扩散步骤的不同阶段,对噪声的增长速率进行动态调整,使得扩散因子在早期增长较快,中后期逐渐趋于平稳,避免了噪声积累过快对生成效果的影响,此外,通过融合扩散因子的统计特征,优化了生成图像的质量,通过对扩散因子的统计特征进行建模。本发明,Gnoise‑sigmoid函数用于控制扩散过程中噪声的增长速率,解决了传统线性或余弦噪声分布在生成过程中的不稳定性问题。通过平滑噪声分布,在早期快速扩散,中后期平稳过渡,减少了噪声过度积累,提升了生成图像的质量。