图像生成模型的训练方法、模型联合训练的方法和装置

    公开(公告)号:CN117523297A

    公开(公告)日:2024-02-06

    申请号:CN202311546380.4

    申请日:2023-11-20

    Abstract: 本说明书的实施例提供了一种图像生成模型的训练方法、模型联合训练的方法和装置。在该图像生成模型的训练方法中,利用原始图像数据集循环执行下述模型训练过程:将当前原始图像数据提供给当前图像生成模型,得到修改后图像数据以及对应的用于指示修改信息的标签数据;进而将修改后图像数据提供给基于初始训练样本集进行初始化的当前图像篡改检测模型,得到对应的篡改检测结果;基于所得到的篡改检测结果,确定图像生成模型在当前模型训练过程的奖励值;基于强化学习算法根据所确定的奖励值调整当前图像生成模型的参数,直至满足第一训练结束条件,其中,经过模型参数调整后的图像生成模型充当下一模型训练过程的当前图像生成模型。

    一种视觉提示生成方法及装置
    4.
    发明公开

    公开(公告)号:CN118229835A

    公开(公告)日:2024-06-21

    申请号:CN202410263259.9

    申请日:2024-03-07

    Abstract: 本说明书实施例披露一种视觉提示的生成方法及装置。该方法包括:首先,利用不同尺度的m个第一窗口分别对第一全局特征图进行分割处理,得到m个第一分区图集;所述第一全局特征图是利用视觉编码器处理目标图像而得到。接着,将任意第i个第一分区图集中各个第一分区图分别作为目标特征图输入感知重采样器,得到对应的第一视觉提示。然后,基于各个第一分区图对应的目标视觉提示,确定所述目标图像对应的多尺度视觉提示;任意第一分区图对应的目标视觉提示根据其对应的第一视觉提示确定;所述多尺度视觉提示用于作为大语言模型的输入。

Patent Agency Ranking