一种时间步自适应的扩散模型训练后量化方法

    公开(公告)号:CN119722506A

    公开(公告)日:2025-03-28

    申请号:CN202411769042.1

    申请日:2024-12-04

    Abstract: 本发明属于扩散模型量化领域,提出了一种时间步自适应的扩散模型训练后量化方法,包括:步骤S1:获取预训练完毕的全精度扩散模型,并确定采样器和采样策略;步骤S2:基于步骤S1得到的全精度扩散模型和所述采样器生成图像并采样,得到训练后量化的校验集;步骤S3:建立扩散模型,对扩散模型进行量化参数初始化;步骤S4:对所述扩散模型进行重建训练;步骤S5:对经过重建训练的扩散模型进行性能评估。本发明能够有效解决现有量化方法忽略通道间激活值范围差距、未考虑迭代推理特定对量化重建的影响以及量化后模型在低量化位宽下性能崩溃的问题,充分发挥时间步感知的训练后量化方法的优势,量化后的扩散模型具有更优的性能和鲁棒性。

Patent Agency Ranking