一种图像生成模型构建方法
    1.
    发明公开

    公开(公告)号:CN119478201A

    公开(公告)日:2025-02-18

    申请号:CN202411401149.0

    申请日:2024-10-09

    Abstract: 本发明提供了一种图像生成模型构建方法,用于生成具有高度复杂性和多样性图像,该方法包括:获取预设训练集,其中,多张图像与目标图像具有部分共同特征;构建初始图像生成模型,所述初始图像生成模型包含预训练图像生成模型、第一特征学习模块、第二特征学习模块,所述预训练图像生成模型包括编码模块、解码模块;模型训练步骤、采用预设训练集对初始图像生成模型进行多轮迭代训练以得到目标图像生成模型,其中,在迭代训练中保持预训练图像生成模型的参数不变,并采用异步优化的方式实现第一特征学习模块、第二特征学习模块的协同优化以优化图像生成模型。本发明提出的方法相较现有的方法,生成的图像具有更高的真实性和多样性。

    一种用于训练图像分类模型的方法

    公开(公告)号:CN118982719A

    公开(公告)日:2024-11-19

    申请号:CN202411121102.9

    申请日:2024-08-15

    Abstract: 本发明提供了一种用于训练图像分类模型的方法,包括:获取当前批次的样本,该批次的样本构成的集合具有长尾分布的性质;将当前批次的样本图像输入模型,利用模型参数确定输入图像的第一分类预测值,根据第一分类预测值、标签和总损失函数确定第一梯度,总损失函数为原始损失函数减去加权系数乘以锐度优化损失函数;根据当前批次中属于每个类别的样本图像对应的第一分类预测值和标签,确定模型参数对应的扰动;将模型参数与扰动相加,得到扰动参数;将当前批次的样本图像输入模型,利用模型的扰动参数确定输入图像的第二分类预测值,根据第二分类预测值、标签和锐度优化损失函数,确定第二梯度;根据第一梯度和第二梯度,更新所述模型参数。

    一种基于软标签自蒸馏的图像分割训练方法

    公开(公告)号:CN117422949A

    公开(公告)日:2024-01-19

    申请号:CN202311411692.4

    申请日:2023-10-27

    Abstract: 本发明提供了一种图像分割训练方法,包括:A1、从预设的图像数据集中,采样一个批次的多个图像;A2、利用当前批次获得的每张基准图像及其候选集合中的每张图像构建一个图像对,得到多个图像对;A3、根据图像对以及当前批次的多个图像分别输入在线分支、目标分支得到的特征图,确定基于图像级子损失和图像块级子损失的总损失;A4、固定目标分支参数,根据总损失更新在线分支的参数;A5、利用历史的多个在线分支的参数,通过指数滑动平均策略更新目标分支的参数;A6、重复步骤A1‑A5以进行自监督训练,直到在线分支训练至收敛后转至步骤A7;A7、获取图像分割模型;A8、利用有监督的图像分割训练集训练图像分割模型,得到经训练的图像分割模型。

    一种推荐模型的训练方法、介质、电子设备和推荐模型

    公开(公告)号:CN112184391B

    公开(公告)日:2023-10-10

    申请号:CN202011109159.9

    申请日:2020-10-16

    Abstract: 本发明实施例提供了一种推荐模型的训练方法、介质、电子设备和推荐模型,训练方法包括A1、构建推荐模型、损失构建模块和多目标优化模块;A2、获取不同用户的商品交互记录,根据用户属性设置不同的用户组;A3、利用商品交互记录对推荐模型进行多次迭代训练至收敛,其中,每次训练包括:A31、用推荐模型从本次获取的商品交互记录中学习用户对商品的决策过程,获取用户对所有商品的偏好概率;A32、基于用户对所有商品的偏好概率,损失构建模块构建第一损失函数用于计算针对不同用户的推荐准确性损失以及构建连续可微的第二损失函数用于计算针对不同的用户组的推荐公平性损失;A33、多目标优化模块根据推荐准确性损失和推荐公平性损失确定参数更新方向。

    一种推荐模型的训练方法、推荐模型及商品推荐方法

    公开(公告)号:CN116308618A

    公开(公告)日:2023-06-23

    申请号:CN202310055941.4

    申请日:2023-01-18

    Abstract: 本发明提供一种推荐模型的训练方法,所述方法包括:S1、获取训练集;S2、利用步骤S1中获得的训练集对推荐模型进行多轮训练直至收敛,且每轮训练包括:S21、获取该用户对应的多个兴趣表征向量,获取该商品对应的属性表征向量;S22、将所有用户的所有兴趣表征向量和所有商品的属性表征向量分别映射到度量空间,以获得每个用户对应的所有兴趣映射向量和每个商品对应的属性映射向量;S23、依次计算每个商品的属性映射向量与每一个用户的所有兴趣映射向量之间的距离并确定每个商品的属性映射向量与每一个用户的所有兴趣映射向量之间的距离中的最小距离;S24、基于步骤S23中获得的最小距离计算偏好损失;S25、基于步骤S24中获得的损失更新推荐模型的参数。

    一种基于动态早退的图像描述生成模型及模型训练方法

    公开(公告)号:CN114743056A

    公开(公告)日:2022-07-12

    申请号:CN202210439734.4

    申请日:2022-04-25

    Abstract: 本发明提供一种基于动态早退的图像描述生成模型,包括:视觉编码器,用于提取图像的视觉特征,其包括多个依次串联的编码层;文本解码器,用于对视觉编码器输出的视觉特征进行解码并依次输出多个预测词汇表中的单词以组成图像的自然语言描述文本,其包括多个依次串联的解码层,每个解码层配置有一个动态早退决策模块和一个模仿学习网络;其中:所述每个动态早退决策模块用于在单词预测过程中根据预测词汇表中的单词预测概率判断当前预测是否需要提前退出、并在预测词汇表中单词的预测概率中的最大概率超过可信度阈值时输出该最大概率对应的单词;所述每个模仿学习网络用于根据输入模仿预测其对应解码层的输出隐含层状态向量。

    一种用于生成视频描述文本的系统和方法

    公开(公告)号:CN113784199A

    公开(公告)日:2021-12-10

    申请号:CN202111060036.5

    申请日:2021-09-10

    Abstract: 本发明提供的一种用于生成视频描述文本的系统,包括:视觉编码模块,用于对待处理的视频进行全局编码,得到全局视频特征,并利用视频分段信息和全局视频特征对相应的视频片段进行局部编码,得到各个视频片段中每个视频帧的视觉模态表征;以及字幕生成模块,用于对视觉模态表征进行嵌入处理,得到文本模态表征,并基于文本模态表征生成描述文本。根据该系统进行的视频描述的生成方法中,生成的描述文本不仅更加具有视觉准确性和视觉一致性,前后文本更加连贯。

Patent Agency Ranking