-
公开(公告)号:CN119444637A
公开(公告)日:2025-02-14
申请号:CN202411509319.7
申请日:2024-10-28
Applicant: 中国科学院计算技术研究所
Abstract: 本申请公开了一种基于多方协同注意力机制的主题图像编辑与生成方法,方法包括:输入多模态指令至主题定位模块,定位作用区域,并在作用区域内提取主题图像和目标图像;将主题图像及目标图像输入预训练的深度学习模型,在自注意层内执行自注意力局部查询,实现整合源图像的背景和主题图像的前景;并执行自注意力全局注入,实现目标图像的细节增强;结合自注意力局部查询及自注意力全局注入的结果,输出编辑和生成的目标图像。本发明极大减少主题类模型生成一致性图像所需的时间,促进其在更广范围内的实际应用。
-
公开(公告)号:CN119888324A
公开(公告)日:2025-04-25
申请号:CN202411947015.9
申请日:2024-12-27
Applicant: 中国科学院计算技术研究所
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06N3/045 , G06N3/0464 , G06N3/096
Abstract: 本发明提供一种基于类增量学习的图像分类模型及其训练方法、分类方法。分类模型包括求解器和特征生成器。其中,求解器包括特征提取器、分类器以及多个辅助分类器。特征提取器用于根据输入的任务进行特征提取输出最终特征。分类器用于根据最终特征对任务进行分类。辅助分类器用于在模型训练时根据学习模块的输出生成嵌入蒸馏的嵌入知识。特征生成器用于在分类器的指导下生成历史任务的生成特征,并将生成特征与当前任务特征通过损失拟合以训练求解器。本发明可以将嵌入在网络中间块中的更丰富的知识从旧的冻结特征提取器迁移到当前的特征提取器来防止特征提取器遗忘,而无需存储历史任务数据或原型。
-
公开(公告)号:CN119741228A
公开(公告)日:2025-04-01
申请号:CN202411828017.6
申请日:2024-12-12
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于混合精度量化的扩散模型极低比特量化方法和装置,包括:获取待极低比特量化的扩散模型,获取该极低比特量化的初始量化精度,增加该初始量化精度得到高比特量化精度,减少该初始量化精度得到低比特量化精度;统计该扩散模型中各组权重数据的长尾分布程度;将该长尾分布程度最高的至少一组权重数据按照该高比特量化精度进行量化,并将该长尾分布程度最低的至少一组权重数据按照该低比特量化精度进行量化,并将该扩散模型的其余权重数据按照该初始量化精度进行量化,得到量化模型;将噪声图像和降噪要求的文本向量输入该量化模型,该量化模型根据该文本向量对该噪声图像进行降噪,得到符合该降噪要求的去噪图像。
-
-