-
公开(公告)号:CN117830422A
公开(公告)日:2024-04-05
申请号:CN202311729942.9
申请日:2023-12-15
Applicant: 之江实验室
IPC: G06T7/80
Abstract: 本发明公开了一种基于多Aruco码的多相机外参标定方法和系统,包括以下步骤:布置多个Aruco码并拍摄多相机图像;识别每张图像中Aruco码的ID并提取每个Aruco码的二维角点坐标;根据Aruco码的二维角点坐标求得Aruco码的相对位姿;构建Aruco码位姿关系图,计算Aruco码的本地坐标系到世界坐标系的变换矩阵得到初始化的Aruco码绝对位姿;构建相机位姿关系图,计算世界坐标系到相机的相机坐标系的变换矩阵得到初始化的相机绝对位姿;通过最小化重投影误差对所有绝对位姿进行全局优化得到最优相机外参。本发明方法能够实现低人工成本、低时间成本和精准的相机外参标定,适用于多相系统外参标定场景。
-
公开(公告)号:CN117314755A
公开(公告)日:2023-12-29
申请号:CN202311605122.9
申请日:2023-11-29
Applicant: 之江实验室 , 中国科学院东北地理与农业生态研究所
IPC: G06T3/40 , G06T5/00 , G06T7/00 , G06V20/70 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/0895
Abstract: 本发明公开了一种基于跨模态图像生成的多视角植株生成方法和装置,属于农业方面的图像处理领域,包括:采集植株图像并标注文本信息;基于图像和文本对文本图像映射模型进行训练微调并冻结,得到图像和文本的内嵌向量;基于图像和文本的内嵌向量,构建基于扩散模型的包含文本图像先验模块和图像编码器模块的图像生成模型并训练;实际推理阶段根据基因型‑表型预测模型得到的目标植株表型数据,引导图像生成模型生成多视角小图,并输入图像超分辨模块得到高分辨率的目标植株图像。本发明采用扩散模型构建图像生成模型和图像超分辨模块,能够实现生成效率高、可扩展性强且生成图像质量高的植株表型数据可视化图像预测,为可视育种提供支撑。
-
公开(公告)号:CN116977652B
公开(公告)日:2023-12-22
申请号:CN202311227139.5
申请日:2023-09-22
Applicant: 之江实验室
IPC: G06V10/30 , G06V10/77 , G06V10/766 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于多模态图像生成的工件表面形貌生成方法和装置,属于机加工数据处理技术领域,包括:基于不同加工方式的历史数据的多模态信息,构建引导向量;基于扩散模型,对表面形貌灰度图的低维表征加噪得到噪声向量,将引导向量、时间步长和噪声向量输入逆向扩散过程,层层降噪还原出低维表征,实现对模型的训练;提取目标多模态信息构建目标引导向量,将随机噪声隐变量和目标引导向量输入到训练好的扩散模型得到目标低维表征,通过解码器得到目标表面形貌灰度图;采用图像质量综合评价模块进行质量评价。本发明采用扩散模型,实现了多模态信息到表面形貌图像的准确映射,(56)对比文件Fujing Tian等.Theoretical andexperimental investigation on modeling ofsurface topography influenced by thetool-workpiece vibration in the cuttingdirection and feeding direction insingle-point diamond turning《.TheInternational Journal of AdvancedManufacturing Technology》.2016,第86卷第2433-2439页.
-
公开(公告)号:CN114757832B
公开(公告)日:2022-09-30
申请号:CN202210663897.0
申请日:2022-06-14
Applicant: 之江实验室
Abstract: 本发明公开一种基于交叉卷积注意力对抗学习的人脸超分辨方法和装置,该方法将原始低分辨率图像输入人脸超分辨生成网络,经过卷积层、若干个全局残差通道注意力单元、粗上采样模块、两批局部残差通道注意力单元、精上采样模块,得到目标分辨率图像,再通过索贝尔算子获得边缘信息,通过低倍率降采样处理并反馈到主网络中进一步提高超分辨效果,利用小波变换将目标分辨率图像、真值图像和其他通过数据增强方式得到的图像进行分解,每个图像分解成一个低频信息、两个中频信息和一个高频信息,然后去掉低频信息,融合中频和高频信息,将其送到对抗网络进行判别,最后引入数据增强方法,以产生多个正负样本进行对抗网络与人脸超分辨网络的迭代优化。
-
公开(公告)号:CN113379606A
公开(公告)日:2021-09-10
申请号:CN202110934749.3
申请日:2021-08-16
Applicant: 之江实验室
Abstract: 本发明属于计算机视觉、图像处理领域,涉及一种基于预训练生成模型的人脸超分辨方法,包括:步骤一、采集并将低分辨率图像输入至特征提取模块,提取特征信息;步骤二、将特征信息输入至编码器,得到通道数为输入尺寸8倍的隐式矩阵,隐式矩阵通过分离模块特征分解后获得隐式向量,与人脸标签数据通过级联方式,分别输入至预训练生成模型中,得到生成特征;步骤三、将生成特征传递给解码器,并融合特征提取模块提取的特征信息,经解码操作后输出目标高分辨率图像。本发明可以将低分辨率的人脸进行高倍率的放大,最高可以获得64倍的超分结果,并且超分辨结果保持较好的保真性,使放大的图像在保真度和纹理真实度方面有更好的改进。
-
公开(公告)号:CN112507997A
公开(公告)日:2021-03-16
申请号:CN202110170037.9
申请日:2021-02-08
Applicant: 之江实验室
Abstract: 本发明公开了一种基于多尺度卷积和感受野特征融合的人脸超分辨系统,该系统包括依次连接的粗超分辨率模块、粗上采样模块、第一多尺度卷积模块、高低频增强模块、精超分辨率模块、精上采样模块、第三度尺度卷积模块、图像增强模块和对抗网络;人脸关键点提取网络和高低频增强模块分别与融合模块连接,所述融合模块、粗超分辨率模块分别与精超分辨率模块连接。该系统适用于人脸的增强,尤其是小分辨率的人脸,通过高低频特征交互增强和人脸先验知识的利用,具有放大倍数高,高频细节还原度高的特点;采用感受野模块有助于提取细节特征并降低计算复杂度。
-
公开(公告)号:CN117314755B
公开(公告)日:2024-02-13
申请号:CN202311605122.9
申请日:2023-11-29
Applicant: 之江实验室 , 中国科学院东北地理与农业生态研究所
IPC: G06T3/4053 , G06T3/4046 , G06T5/60 , G06T5/70 , G06T7/00 , G06V20/70 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0475 , G06N3/0895
Abstract: 本发明公开了一种基于跨模态图像生成的多视角植株生成方法和装置,属于农业方面的图像处理领域,包括:采集植株图像并标注文本信息;基于图像和文本对文本图像映射模型进行训练微调并冻结,得到图像和文本的内嵌向量;基于图像和文本的内嵌向量,构建基于扩散模型的包含文本图像先验模块和图像编码器模块的图像生成模型并训练;实际推理阶段根据基因型‑表型预测模型得到的目标植株表型数据,引导图像生成模型生成多视角小图,并输入图像超分辨模块得到高分辨率的目标植株图像。本发明采用扩散模型构建图像生成模型和图像超分辨模块,
-
公开(公告)号:CN116977652A
公开(公告)日:2023-10-31
申请号:CN202311227139.5
申请日:2023-09-22
Applicant: 之江实验室
IPC: G06V10/30 , G06V10/77 , G06V10/766 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于多模态图像生成的工件表面形貌生成方法和装置,属于机加工数据处理技术领域,包括:基于不同加工方式的历史数据的多模态信息,构建引导向量;基于扩散模型,对表面形貌灰度图的低维表征加噪得到噪声向量,将引导向量、时间步长和噪声向量输入逆向扩散过程,层层降噪还原出低维表征,实现对模型的训练;提取目标多模态信息构建目标引导向量,将随机噪声隐变量和目标引导向量输入到训练好的扩散模型得到目标低维表征,通过解码器得到目标表面形貌灰度图;采用图像质量综合评价模块进行质量评价。本发明采用扩散模型,实现了多模态信息到表面形貌图像的准确映射,具有快速生成、高保真性的特点,对实时表面形貌预测有极大潜力。
-
公开(公告)号:CN113379606B
公开(公告)日:2021-12-07
申请号:CN202110934749.3
申请日:2021-08-16
Applicant: 之江实验室
Abstract: 本发明属于计算机视觉、图像处理领域,涉及一种基于预训练生成模型的人脸超分辨方法,包括:步骤一、采集并将低分辨率图像输入至特征提取模块,提取特征信息;步骤二、将特征信息输入至编码器,得到通道数为输入尺寸8倍的隐式矩阵,隐式矩阵通过分离模块特征分解后获得隐式向量,与人脸标签数据通过级联方式,分别输入至预训练生成模型中,得到生成特征;步骤三、将生成特征传递给解码器,并融合特征提取模块提取的特征信息,经解码操作后输出目标高分辨率图像。本发明可以将低分辨率的人脸进行高倍率的放大,最高可以获得64倍的超分结果,并且超分辨结果保持较好的保真性,使放大的图像在保真度和纹理真实度方面有更好的改进。
-
公开(公告)号:CN113284051B
公开(公告)日:2021-12-07
申请号:CN202110834275.5
申请日:2021-07-23
Applicant: 之江实验室
IPC: G06T3/40
Abstract: 本发明属于计算机视觉、图像处理领域,涉及一种基于频率分解多注意力机制的人脸超分辨方法,利用小波变换及其逆变换均可逆的性质,将输入的低分辨率人脸图像进行频率分解,针对不同频率的特征,采用不同的核卷积构建基础模块,自适应集成不同感受野的特征,利用残差注意力模块,包含像素、空间和通道注意力机制,对不同频率的特征分别进行处理,低频部分纹理采用较少计算量的注意力,高频部分采用更多的残差注意力模块,在保持计算量的同时将更多的网络应用于高频部分,利用预训练的人脸关键点提取网络进行关键点提取并进行反馈,增强轮廓特征,利用生成抵抗网络增强纹理特征。
-
-
-
-
-
-
-
-
-