基于文生图扩散模型的图像生成内容抑制方法及系统

    公开(公告)号:CN117251589A

    公开(公告)日:2023-12-19

    申请号:CN202310935657.6

    申请日:2023-07-27

    Applicant: 南开大学

    Abstract: 本公开提供了基于文生图扩散模型的图像生成内容抑制方法及系统,涉及图像生成技术领域,包括将文本输入目标提示词映射为文本嵌入;将文本嵌入分为期望被抑制的嵌入以及鼓励保留的嵌入两个部分,构造目标文本嵌入矩阵,对所述目标文本嵌入矩阵进行奇异值分解,提取被抑制的语义信息;为每个奇异值引入软加权正则化,还原目标文本嵌入矩阵;将目标文本嵌入矩阵输入至扩散模型中,通过交叉注意力输出对应的期望被抑制特征注意图以及鼓励保留特征注意图,提出两个注意力损失评估注意力图;引入对齐损失和多样性损失,抑制期望被抑制的主体的生成,最后生成移除期望被抑制实体后的图像。本公开提高SD模型生成预期主体并抑制不需要的主体的能力。

    一种基于三维分解哈希编码的动态场景渲染方法及系统

    公开(公告)号:CN118840471A

    公开(公告)日:2024-10-25

    申请号:CN202410952228.4

    申请日:2024-07-16

    Applicant: 南开大学

    Abstract: 本发明公开一种基于三维分解哈希编码的动态场景渲染方法及系统,涉及三维视觉动态场景渲染技术领域,包括:获取指定时段内拍摄的待渲染图像及拍摄时刻和相机位姿,初始化三维高斯函数;对由待渲染图像的拍摄时刻和三维高斯函数的中心位置坐标组成的四维坐标进行三维分解,对每个三维坐标进行哈希编码;将得到的特征进行方向注意力机制的特征融合;解码融合特征,得到三维高斯函数的参数在拍摄时刻下的变化值,根据变化值调整三维高斯函数的参数;将调整的三维高斯函数根据相机位姿,采用可微光栅化渲染方式渲染得到场景图像。三维分解哈希编码和方向注意力机制共同作用,提高特征的表达能力和准确度,实现指定时段内任意视角下场景图像的渲染。

Patent Agency Ranking