-
公开(公告)号:CN119904540A
公开(公告)日:2025-04-29
申请号:CN202411836972.4
申请日:2024-12-13
Applicant: 上海交通大学
IPC: G06T11/00 , G06N3/047 , G06V10/44 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种基于扩散概率模型的图像生成方法、电子设备、存储介质,利用预训练好的扩散概率模型生成图像,扩散概率模型的训练过程包括如下步骤:获取原始训练样本,利用图像特征提取网络提取得到图像特征向量;基于所述图像特征向量,利用带温度的softmax层得到类别向量;基于随机采样的噪声等级,对所述原始训练样本进行加噪,得到加噪训练样本;基于所述加噪训练样本、所述噪声等级和所述类别向量,利用去噪神经网络得到预测样本;基于所述原始训练样本和预测样本,通过计算训练误差,更新所述图像特征提取网络和所述去噪神经网络,实现扩散概率模型的训练。与现有技术相比,本发明具有生成图片与特定类别的特性更加匹配等优点。
-
公开(公告)号:CN119990247A
公开(公告)日:2025-05-13
申请号:CN202411858538.6
申请日:2024-12-17
Applicant: 上海交通大学
IPC: G06N3/094 , G06N3/045 , G06N3/0475 , G06N3/047 , G06N3/09 , G06N3/0464 , G06V10/82 , G06T11/00
Abstract: 本发明涉及一种基于引导采样提高生成对抗网络生成图像质量的方法及系统其中方法包括以下步骤:获取图像训练集,以及图像训练集中的图像对应的类别或文本标签信息,将图像和其对应的标签信息配对成 的形式,构建图像标签训练集;利用图像标签训练集训练生成对抗网络,所述生成对抗网络包括生成器和判别器,在生成对抗网络训练过程中通过概率调整训练数据标签的类别,并引入生成器和判别器的共同归一化损失函数进行参数更新;获取潜在向量,基于引导采样算法生成中间变量,作为训练好的生成对抗网络的输入,利用训练后的生成对抗网络生成高质量合成图像。与现有技术相比,本发明具有训练稳定、图像生成效果好等优点。
-
公开(公告)号:CN119904541A
公开(公告)日:2025-04-29
申请号:CN202411836974.3
申请日:2024-12-13
Applicant: 上海交通大学
IPC: G06T11/00 , G06N3/0455 , G06V10/44 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 本发明涉及一种基于多条件控制扩散模型的图像生成方法和电子设备,包括如下步骤:步骤S1,获取图像训练集,针对其中每个图像数据,提取图像的多个条件,构建训练样本;步骤S2,基于所述训练样本,以最小化变分自编码器预测得到的预测条件与实际条件之间的区别为目标,对变分自编码器进行训练;步骤S3,随机选取一个或多个条件作为子集,利用所述变分自编码器计算子集对应的编码特征,基于所述编码特征以及加噪后的图像数据,以最小化预测的噪声和真实的噪声之间的差别为目标,对扩散模型进行训练;步骤S4,利用训练后的扩散模型实现图像生成。与现有技术相比,本发明具有有效管理和整合多个输入条件、有效管理条件冲突等优点。
-
公开(公告)号:CN112036511B
公开(公告)日:2024-04-30
申请号:CN202011060588.1
申请日:2020-09-30
Applicant: 上海美迪索科电子科技有限公司 , 上海交通大学
IPC: G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/084 , G06N20/20
Abstract: 本发明提供一种基于注意力机制—图卷积网络以及课程学习的基于内容的图像检索方法,包括下列步骤:根据数据集的特征分布情况划分数据集,将数据集划分为简单、中等和困难以及不可使用四种字集,利用课程学习原理由易到难将四种子集输入到深度学习神经网络中。然后使用基于图卷积的深度学习网络模块提取图片的显著特征,构建图片的空间特征图并进行推理得到最终的特征表示。最后使用最终的特征表示进行关联匹配进行图像检索。
-
公开(公告)号:CN112036511A
公开(公告)日:2020-12-04
申请号:CN202011060588.1
申请日:2020-09-30
Applicant: 上海美迪索科电子科技有限公司 , 上海交通大学
Abstract: 本发明提供一种基于注意力机制—图卷积网络以及课程学习的基于内容的图像检索方法,包括下列步骤:根据数据集的特征分布情况划分数据集,将数据集划分为简单、中等和困难以及不可使用四种字集,利用课程学习原理由易到难将四种子集输入到深度学习神经网络中。然后使用基于图卷积的深度学习网络模块提取图片的显著特征,构建图片的空间特征图并进行推理得到最终的特征表示。最后使用最终的特征表示进行关联匹配进行图像检索。
-
公开(公告)号:CN110332929A
公开(公告)日:2019-10-15
申请号:CN201910619114.7
申请日:2019-07-10
Applicant: 上海交通大学
Abstract: 本发明提供了一种车载行人定位系统及方法,该方法包括:根据预设的采样周期获取包含行人的视频图像;通过训练好的神经网络获取所述视频图像中的行人坐标;根据所述视频图像获取图片视差,并根据图片视差与深度值的关系,以及所述视频图像中的行人坐标预估行人相对车辆的距离;获取车辆的实时位置信息;将车辆的实时位置信息转换为本地坐标系下的坐标值,并结合所述行人相对车辆的距离,得到行人的GPS坐标信息;根据行人的GPS坐标信息,在地图上实时显示车辆和行人的位置。本发明简洁易行,对设备、环境的依赖较少,且可以实时的输出车辆及行人在地图上的位置。
-
-
-
-
-