Patent search ap:("中国科学院自动化研究所") AND inv:"王金桥" Page 10

91.

发明公开
图像生成方法、装置及存储介质有权

公开(公告)号：CN117197268A

公开(公告)日：2023-12-08

申请号：CN202310946688.1

申请日：2023-07-27

Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所

Inventor： 刘智威 , 陈琦 , 吴凌翔 , 王金桥

IPC: G06T11/00 , G06N3/09 , G06N3/0455

Abstract: 本申请提供一种图像生成方法、装置及存储介质。该图像生成方法包括：将待处理提示词输入至预训练的第一稳定扩散模型，得到所述待处理提示词对应的表观图像，并将待处理提示词输入至边缘图生成模型，得到所述待处理提示词对应的第一边缘图像；基于所述表观图像和所述第一边缘图像生成与所述待处理提示词相关联的图像。本申请提供的图像生成方法、装置及存储介质，提取小样本类别图像的表观信息和边缘信息，并用其联合进行相应类别的图像生成，提高了基于小样本图像的图像生成模型的训练精度以及泛化能力，从而提高了小样本图像生成的准确性。

92.

发明公开
小语料语音克隆方法及装置审中-实审

公开(公告)号：CN117059065A

公开(公告)日：2023-11-14

申请号：CN202310949009.6

申请日：2023-07-28

Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所

Inventor： 黄志强 , 陈庭威 , 吴凌翔 , 王金桥

IPC: G10L13/027 , G10L13/08 , G10L13/04 , G10L25/06

Abstract: 本申请提供一种小语料语音克隆方法及装置。该小语料语音克隆方法包括：基于目标说话人的克隆语料，利用相似度匹配法从多人大语料库中确定大库相似语料；基于所述大库相似语料和所述克隆语料训练目标语音合成模型；将待处理文本输入至所述目标语音合成模型中进行语音合成，得到所述待处理文本对应的目标说话人的语音。本申请提供的小语料语音克隆方法及装置，基于目标说话人的克隆语料以及大语料库中的与目标说话人的声纹特征相似的语料对语音合成模型进行结伴训练，提高了对小语料的语音合成模型的训练精度，从而提高了小语料语音克隆的发音稳定性和音色还原度。

93.

发明公开
图像配准方法、装置及存储介质审中-实审

公开(公告)号：CN116977381A

公开(公告)日：2023-10-31

申请号：CN202310870900.0

申请日：2023-07-14

Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所

Inventor： 易东 , 胡涛 , 吴凌翔 , 朱贵波 , 王金桥

IPC: G06T7/33

Abstract: 本申请提供一种图像配准方法、装置及存储介质。该图像配准方法包括：获取第一图像和第二图像中的重复结构；所述第一图像和所述第二图像为同一物体的两张图像；基于所述重复结构对应的轮廓点位置信息进行图像配准，得到所述第一图像和所述第二图像间的几何变换参数。本申请提供的图像配准方法、装置及存储介质，以第一图像和第二图像中的重复结构对应的轮廓点作为图像中的物体特征，基于轮廓点位置信息进行图像配准，解决了关键点缺失问题，并可以应用于各新场景，提高了图像配准的准确率。

94.

发明授权
图像重建模型的迭代方法和图像重建方法有权

公开(公告)号：CN116030156B

公开(公告)日：2023-07-18

申请号：CN202310161883.3

申请日：2023-02-24

Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院

Inventor： 朱优松 , 李朝闻 , 陈志扬 , 赵朝阳 , 唐明 , 王金桥

IPC: G06T11/00 , G06V10/74 , G06V10/774 , G06T5/50

Abstract: 本发明涉及图像处理技术领域，提供了一种图像重建模型的迭代方法和图像重建方法，其中图像重建模型的迭代方法包括：基于原始图像进行掩码，得到多个掩码图像；基于初始图像重建模型，对各个掩码图像中的掩码区域进行重建，得到所述各个掩码图像对应的重建图像；确定各个重建图像中两两重建图像之间的重叠区域，基于两两重建图像中重叠区域的区域特征之间的特征相似度，对所述初始图像重建模型进行参数迭代，得到图像重建模型，解决了传统方案中模型具有高度的不确定性和不一致性的问题，通过自洽机制可以使得不同重建图像之间的重叠区域保持一致，提升了模型的训练效率，同时优化了模型的预测准确率。

95.

发明公开
图像重建模型的迭代方法和图像重建方法有权

公开(公告)号：CN116030156A

公开(公告)日：2023-04-28

申请号：CN202310161883.3

申请日：2023-02-24

Applicant: 中国科学院自动化研究所 , 武汉人工智能研究院

Inventor： 朱优松 , 李朝闻 , 陈志扬 , 赵朝阳 , 唐明 , 王金桥

IPC: G06T11/00 , G06V10/74 , G06V10/774 , G06T5/50

Abstract: 本发明涉及图像处理技术领域，提供了一种图像重建模型的迭代方法和图像重建方法，其中图像重建模型的迭代方法包括：基于原始图像进行掩码，得到多个掩码图像；基于初始图像重建模型，对各个掩码图像中的掩码区域进行重建，得到所述各个掩码图像对应的重建图像；确定各个重建图像中两两重建图像之间的重叠区域，基于两两重建图像中重叠区域的区域特征之间的特征相似度，对所述初始图像重建模型进行参数迭代，得到图像重建模型，解决了传统方案中模型具有高度的不确定性和不一致性的问题，通过自洽机制可以使得不同重建图像之间的重叠区域保持一致，提升了模型的训练效率，同时优化了模型的预测准确率。

96.

发明公开
一种目标检测方法、装置、设备及存储介质有权

公开(公告)号：CN115953665A

公开(公告)日：2023-04-11

申请号：CN202310221030.4

申请日：2023-03-09

Applicant: 武汉人工智能研究院 , 中国科学院自动化研究所

Inventor： 王金桥 , 李宗树 , 朱贵波 , 吴凌翔 , 刘智威 , 葛国敬

IPC: G06V10/82 , G06V10/764 , G06V10/52 , G06V10/25 , G06N3/0464 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/08

Abstract: 本申请实施例提供一种目标检测方法、装置、设备及存储介质，涉及图形数据读取技术领域，所述方法包括：基于视觉transformer模型获取的查询特征图序列和支持特征图序列进行相关性汇聚运算的结果，确定第二查询特征图序列；基于第二查询特征图序列的自注意力运算和/或交叉注意力运算的结果，确定用于获取查询特征图序列的查询图像对应的预测结果。本申请提供的目标检测方法，极大地缩短了视觉transformer模型的收敛时间，降低了利用该模型预测边界框的难度，既能有效地提取查询图像中和支持类别相关的目标特征区域，同时能够使查询分支不局限于特定支持类别目标实例，能检测任意类别的目标实例。

97.

发明公开
图像生成方法、图像去噪模型的训练方法和设备有权

公开(公告)号：CN115222630A

公开(公告)日：2022-10-21

申请号：CN202210948018.9

申请日：2022-08-09

Applicant: 中国科学院自动化研究所

Inventor： 吴凌翔 , 王金桥 , 牛蕴方

IPC: G06T5/00 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种图像生成方法、图像去噪模型的训练方法和设备，涉及图像生成技术领域，解决了如何生成与引导信息的信息内容相匹配的目标无噪声图像的问题。该方法包括：先获取待处理的噪声图像、噪声图像对应的引导信息、目标加噪阶段和空引导信息；引导信息包括语义轮廓图像，或者，包括语义轮廓图像和目标文本；并基于噪声图像、引导信息、目标加噪阶段及空引导信息，对噪声图像进行去噪处理，生成目标无噪声图像；其中，目标无噪声图像的图像内容与引导信息的信息内容的匹配度大于第一阈值。这样结合引导信息和空引导信息对噪声图像进行去噪处理，可以生成与引导信息的信息内容相匹配的目标无噪声图像，提高了生成的目标无噪声图像的准确度。

98.

发明公开
基于一致性损失的细粒度图像模型训练及识别方法和装置有权

公开(公告)号：CN114821203A

公开(公告)日：2022-07-29

申请号：CN202210745986.X

申请日：2022-06-29

Applicant: 中国科学院自动化研究所

Inventor： 郭海云 , 吴畏 , 王金桥 , 唐明

IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/26 , G06N3/04 , G06N3/08

Abstract: 本申请提供一种基于一致性损失的细粒度图像模型训练及识别方法和装置，涉及图像处理领域，该方法包括：获取样本图像对应的变换图像；将所述样本图像输入至图像识别模型，得到所述样本图像对应的第一行向量和第一列向量；将所述变换图像输入至所述图像识别模型，得到所述变换图像对应的第二行向量和第二列向量；根据所述第一行向量、所述第一列向量、所述第二行向量、所述第二列向量和所述样本图像的标注类别，对所述图像识别模型的参数进行调整。提高了图像识别模型的鲁棒性，以及图像识别模型对于图像的识别准确率。

99.

发明公开
图像生成器的训练方法、装置、电子设备和可读存储介质有权

公开(公告)号：CN114782291A

公开(公告)日：2022-07-22

申请号：CN202210715667.4

申请日：2022-06-23

Applicant: 中国科学院自动化研究所

Inventor： 葛国敬 , 王金桥 , 朱贵波

IPC: G06T5/00 , G06K9/62 , G06V10/774

Abstract: 本发明提供一种图像生成器的训练方法、装置、电子设备和可读存储介质，涉及图像处理技术领域，通过将降质样本人脸图像输入至图像生成器中得到修复样本人脸图像，图像生成器基于Transformer模型构建；基于原始样本人脸图像和修复样本人脸图像对图像判别器以及图像生成器进行优化；重复优化图像判别器以及优化图像生成器的步骤，直至达到预设收敛条件，以通过优化后的图像生成器对待修复人脸图像进行图像盲修复处理，实现了端对端的图像盲修复功能，训练过程不需要人工干预，训练路径比较简单，克服了现有技术中单个阶段无法获得理想的训练结果、训练过程需要人工干预和训练路径繁琐复杂的缺陷。

100.

发明授权
图像扫描识别方法、装置及电子设备有权转让

公开(公告)号：CN114429636B

公开(公告)日：2022-07-12

申请号：CN202210353468.3

申请日：2022-04-06

Applicant: 中国科学院自动化研究所

Inventor： 王金桥 , 葛国敬 , 朱贵波

IPC: G06V30/412 , G06V30/18 , G06V30/19 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本发明提供一种图像扫描识别方法、装置及电子设备，该方法包括：对于当前次迭代，根据掩码区域，与下一帧局部图片进行图像块匹配后进行图像拼接同时更新下次迭代需要的掩码区域；最初掩码区域是基于对初始帧局部图片进行文本检测的结果获取的；对于拼接后的整体图片，若满足预设条件，则进行文本检测，并在文本检测结果满足预设识别条件的情况下，对拼接图片进行文本识别；继续执行下一次迭代，直到扫描笔停止扫描；根据每次迭代过程中得到的拼接图片的文本识别结果，获取扫描笔的图像扫描结果。本发明实现在计算资源和存储资源受限的低配置设备上达到良好实时性的同时，提高了图像拼接和识别的效率和精度。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification