-
公开(公告)号:CN117314755A
公开(公告)日:2023-12-29
申请号:CN202311605122.9
申请日:2023-11-29
Applicant: 之江实验室 , 中国科学院东北地理与农业生态研究所
IPC: G06T3/40 , G06T5/00 , G06T7/00 , G06V20/70 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/0895
Abstract: 本发明公开了一种基于跨模态图像生成的多视角植株生成方法和装置,属于农业方面的图像处理领域,包括:采集植株图像并标注文本信息;基于图像和文本对文本图像映射模型进行训练微调并冻结,得到图像和文本的内嵌向量;基于图像和文本的内嵌向量,构建基于扩散模型的包含文本图像先验模块和图像编码器模块的图像生成模型并训练;实际推理阶段根据基因型‑表型预测模型得到的目标植株表型数据,引导图像生成模型生成多视角小图,并输入图像超分辨模块得到高分辨率的目标植株图像。本发明采用扩散模型构建图像生成模型和图像超分辨模块,能够实现生成效率高、可扩展性强且生成图像质量高的植株表型数据可视化图像预测,为可视育种提供支撑。
-
公开(公告)号:CN116977652B
公开(公告)日:2023-12-22
申请号:CN202311227139.5
申请日:2023-09-22
Applicant: 之江实验室
IPC: G06V10/30 , G06V10/77 , G06V10/766 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于多模态图像生成的工件表面形貌生成方法和装置,属于机加工数据处理技术领域,包括:基于不同加工方式的历史数据的多模态信息,构建引导向量;基于扩散模型,对表面形貌灰度图的低维表征加噪得到噪声向量,将引导向量、时间步长和噪声向量输入逆向扩散过程,层层降噪还原出低维表征,实现对模型的训练;提取目标多模态信息构建目标引导向量,将随机噪声隐变量和目标引导向量输入到训练好的扩散模型得到目标低维表征,通过解码器得到目标表面形貌灰度图;采用图像质量综合评价模块进行质量评价。本发明采用扩散模型,实现了多模态信息到表面形貌图像的准确映射,(56)对比文件Fujing Tian等.Theoretical andexperimental investigation on modeling ofsurface topography influenced by thetool-workpiece vibration in the cuttingdirection and feeding direction insingle-point diamond turning《.TheInternational Journal of AdvancedManufacturing Technology》.2016,第86卷第2433-2439页.
-
公开(公告)号:CN117095240A
公开(公告)日:2023-11-21
申请号:CN202311332316.6
申请日:2023-10-16
Applicant: 之江实验室 , 中国科学院东北地理与农业生态研究所
IPC: G06V10/764 , G06V10/44 , G06V10/42 , G06V10/26 , G06V10/82 , G06N3/0464 , G06N3/094
Abstract: 一种基于细粒度特征的叶片分类方法和系统,其方法包含:叶片图像随机混乱模块对同一类的两张叶片图像分区块之后,再把所有区块进行随机重组,得到两张相同数量和尺寸的重组叶片图像,以混乱叶片的全局特征;使用深度学习网络提取叶片的原图特征和重组图特征:训练时,在特征层后面加全连接层,并计算分类损失和对抗损失向前传播;测试时,使用模型便可以提取原图的局部细粒度特征和全局特征,从而实现对叶片的分类。本发明对叶片图像进行重组,模型在重组图像上得不到全局特征时,将专注于学习叶片的局部细粒度特征,而原始图像的输入又可以提供模型全局特征的学习,从而大大提高叶片分类的精度。
-
公开(公告)号:CN114998999B
公开(公告)日:2022-12-06
申请号:CN202210856428.0
申请日:2022-07-21
Abstract: 本发明公开一种基于多帧输入与轨迹平滑的多目标跟踪方法和装置,方法包括:步骤S1:获取行人视频数据集并进行行人坐标以及行人轨迹的标注,并生成片段型轨迹数据;步骤S2:构造并训练基于多帧输入与轨迹平滑的行人多目标跟踪网络模型;步骤S3:基于训练得到的行人多目标跟踪网络模型进行推理,获取当前帧行人目标检测与特征提取结果以及其前几帧的行人目标检测与特征提取结果,即获取得到多帧图像目标的坐标及外观特征;步骤S4:利用多帧图像目标的坐标及外观特征进行最短特征距离匹配,并利用轨迹曲率平滑函数进行轨迹平滑,最终得到当前帧的轨迹。本发明具有耗时低,且对同类目标的遮挡问题鲁棒性较好的优点。
-
公开(公告)号:CN114757822B
公开(公告)日:2022-11-04
申请号:CN202210663896.6
申请日:2022-06-14
Abstract: 本发明公开一种基于双目的人体三维关键点检测方法及系统,该方法包括:步骤一:通过采用YOLOv5目标检测算法的目标检测模块分别获得左、右视场图像中的人体矩形框;步骤二:扣取人体矩形框对应的人体图像,通过人体二维关键点识别算法提取左、右视场图像中人体各关键点的二维热力图;步骤三:将左、右人体二维关键点热力图反向投影到三维空间,得到三维反投影热力图;步骤四,将三维反投影热力图输入三维卷积编解码网络,通过编解码操作得到三维关键点热力图;步骤五,三维关键点热力图中每一通道通过自变量最大值软操作得到该通道表示的三维关键点所在坐标,最终得到全部人体三维关键点坐标。本发明具有较高的可行性和实用性。
-
公开(公告)号:CN114757832B
公开(公告)日:2022-09-30
申请号:CN202210663897.0
申请日:2022-06-14
Applicant: 之江实验室
Abstract: 本发明公开一种基于交叉卷积注意力对抗学习的人脸超分辨方法和装置,该方法将原始低分辨率图像输入人脸超分辨生成网络,经过卷积层、若干个全局残差通道注意力单元、粗上采样模块、两批局部残差通道注意力单元、精上采样模块,得到目标分辨率图像,再通过索贝尔算子获得边缘信息,通过低倍率降采样处理并反馈到主网络中进一步提高超分辨效果,利用小波变换将目标分辨率图像、真值图像和其他通过数据增强方式得到的图像进行分解,每个图像分解成一个低频信息、两个中频信息和一个高频信息,然后去掉低频信息,融合中频和高频信息,将其送到对抗网络进行判别,最后引入数据增强方法,以产生多个正负样本进行对抗网络与人脸超分辨网络的迭代优化。
-
公开(公告)号:CN114648723A
公开(公告)日:2022-06-21
申请号:CN202210454687.0
申请日:2022-04-28
Abstract: 本发明涉及智能视频监控及深度学习领域,尤其涉及一种基于时间一致性对比学习的动作规范性检测方法和装置,该方法为:首先将第一数量标注和第二数量未标注的通过摄像头采集的视频构建数据集,第一数量小于第二数量;然后将未标注视频经过强弱数据增强后提取特征,再输入时间一致性行为对齐网络,输出特征图和不同样本间相似动作起始与结束帧集合,映射集合在特征图上对应子特征图,构造同类与不同类子特征图样本,送入对比学习网络提取时空判别性特征;再将第一数量标注视频送入预训练后的网络进行迁移学习,输出行为类别;最后通过帧间行为类别变化判断行为规范性,若不规范则发出预警。
-
公开(公告)号:CN113822262B
公开(公告)日:2022-04-15
申请号:CN202111412831.6
申请日:2021-11-25
Applicant: 之江实验室
IPC: G06V20/52 , G06V10/762 , G06V10/774 , G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于无监督学习的行人重识别方法,在特征存储器中只保存聚类得到的类中心,采用分组采样的方式获取小样本集,并结合难例挖掘的方法更新存储器中的特征向量和特征提取网络模型参数,实现了在无标签数据集上的伪标签自动生成,增强了模型对于噪声数据的鲁棒性,大大减小了存储器对于内存空间的高额要求。本发明剔除了离群样本点对聚类中心的干扰,避免了随机采样导致的过拟合等问题,在小样本迭代过程中不更改数据标签,降低了标签跳变等噪声数据对于模型稳定性的影响,加速了模型的收敛,提高行人重识别模型在不同场景下的泛化能力。
-
公开(公告)号:CN113379606A
公开(公告)日:2021-09-10
申请号:CN202110934749.3
申请日:2021-08-16
Applicant: 之江实验室
Abstract: 本发明属于计算机视觉、图像处理领域,涉及一种基于预训练生成模型的人脸超分辨方法,包括:步骤一、采集并将低分辨率图像输入至特征提取模块,提取特征信息;步骤二、将特征信息输入至编码器,得到通道数为输入尺寸8倍的隐式矩阵,隐式矩阵通过分离模块特征分解后获得隐式向量,与人脸标签数据通过级联方式,分别输入至预训练生成模型中,得到生成特征;步骤三、将生成特征传递给解码器,并融合特征提取模块提取的特征信息,经解码操作后输出目标高分辨率图像。本发明可以将低分辨率的人脸进行高倍率的放大,最高可以获得64倍的超分结果,并且超分辨结果保持较好的保真性,使放大的图像在保真度和纹理真实度方面有更好的改进。
-
公开(公告)号:CN112990371A
公开(公告)日:2021-06-18
申请号:CN202110459160.2
申请日:2021-04-27
Applicant: 之江实验室
Abstract: 本发明属于计算机视觉识别技术领域,涉及一种基于特征扩增的无监督夜间图像分类方法。采用具有白天图像分类标签的公开数据集训练分类网络,经分类网络提取输入图像的特征向量,并计算各类别的特征均值与协方差矩阵;将无标签的夜间图像输入分类网络获得该图像的伪标签,根据伪标签计算夜间图像各类别在特征空间的特征均值与协方差矩阵;对同类别的白天、夜间图像获取的协方差矩阵进行加权平均获得最终协方差矩阵;根据各类别夜间图像特征均值和加权平均后的协方差矩阵进行特征采样;将采样的特征值与原有特征值共同重新训练分类网络。本发明通过学习有标签的白天图像的特征分布,在特征层面对夜间数据进行扩增,从而实现对夜间图像的无监督分类。
-
-
-
-
-
-
-
-
-