图像生成方法、装置及存储介质

    公开(公告)号:CN117197268A

    公开(公告)日:2023-12-08

    申请号:CN202310946688.1

    申请日:2023-07-27

    Abstract: 本申请提供一种图像生成方法、装置及存储介质。该图像生成方法包括:将待处理提示词输入至预训练的第一稳定扩散模型,得到所述待处理提示词对应的表观图像,并将待处理提示词输入至边缘图生成模型,得到所述待处理提示词对应的第一边缘图像;基于所述表观图像和所述第一边缘图像生成与所述待处理提示词相关联的图像。本申请提供的图像生成方法、装置及存储介质,提取小样本类别图像的表观信息和边缘信息,并用其联合进行相应类别的图像生成,提高了基于小样本图像的图像生成模型的训练精度以及泛化能力,从而提高了小样本图像生成的准确性。

    小语料语音克隆方法及装置
    92.
    发明公开

    公开(公告)号:CN117059065A

    公开(公告)日:2023-11-14

    申请号:CN202310949009.6

    申请日:2023-07-28

    Abstract: 本申请提供一种小语料语音克隆方法及装置。该小语料语音克隆方法包括:基于目标说话人的克隆语料,利用相似度匹配法从多人大语料库中确定大库相似语料;基于所述大库相似语料和所述克隆语料训练目标语音合成模型;将待处理文本输入至所述目标语音合成模型中进行语音合成,得到所述待处理文本对应的目标说话人的语音。本申请提供的小语料语音克隆方法及装置,基于目标说话人的克隆语料以及大语料库中的与目标说话人的声纹特征相似的语料对语音合成模型进行结伴训练,提高了对小语料的语音合成模型的训练精度,从而提高了小语料语音克隆的发音稳定性和音色还原度。

    图像配准方法、装置及存储介质
    93.
    发明公开

    公开(公告)号:CN116977381A

    公开(公告)日:2023-10-31

    申请号:CN202310870900.0

    申请日:2023-07-14

    Abstract: 本申请提供一种图像配准方法、装置及存储介质。该图像配准方法包括:获取第一图像和第二图像中的重复结构;所述第一图像和所述第二图像为同一物体的两张图像;基于所述重复结构对应的轮廓点位置信息进行图像配准,得到所述第一图像和所述第二图像间的几何变换参数。本申请提供的图像配准方法、装置及存储介质,以第一图像和第二图像中的重复结构对应的轮廓点作为图像中的物体特征,基于轮廓点位置信息进行图像配准,解决了关键点缺失问题,并可以应用于各新场景,提高了图像配准的准确率。

    图像重建模型的迭代方法和图像重建方法

    公开(公告)号:CN116030156B

    公开(公告)日:2023-07-18

    申请号:CN202310161883.3

    申请日:2023-02-24

    Abstract: 本发明涉及图像处理技术领域,提供了一种图像重建模型的迭代方法和图像重建方法,其中图像重建模型的迭代方法包括:基于原始图像进行掩码,得到多个掩码图像;基于初始图像重建模型,对各个掩码图像中的掩码区域进行重建,得到所述各个掩码图像对应的重建图像;确定各个重建图像中两两重建图像之间的重叠区域,基于两两重建图像中重叠区域的区域特征之间的特征相似度,对所述初始图像重建模型进行参数迭代,得到图像重建模型,解决了传统方案中模型具有高度的不确定性和不一致性的问题,通过自洽机制可以使得不同重建图像之间的重叠区域保持一致,提升了模型的训练效率,同时优化了模型的预测准确率。

    图像重建模型的迭代方法和图像重建方法

    公开(公告)号:CN116030156A

    公开(公告)日:2023-04-28

    申请号:CN202310161883.3

    申请日:2023-02-24

    Abstract: 本发明涉及图像处理技术领域,提供了一种图像重建模型的迭代方法和图像重建方法,其中图像重建模型的迭代方法包括:基于原始图像进行掩码,得到多个掩码图像;基于初始图像重建模型,对各个掩码图像中的掩码区域进行重建,得到所述各个掩码图像对应的重建图像;确定各个重建图像中两两重建图像之间的重叠区域,基于两两重建图像中重叠区域的区域特征之间的特征相似度,对所述初始图像重建模型进行参数迭代,得到图像重建模型,解决了传统方案中模型具有高度的不确定性和不一致性的问题,通过自洽机制可以使得不同重建图像之间的重叠区域保持一致,提升了模型的训练效率,同时优化了模型的预测准确率。

    图像生成方法、图像去噪模型的训练方法和设备

    公开(公告)号:CN115222630A

    公开(公告)日:2022-10-21

    申请号:CN202210948018.9

    申请日:2022-08-09

    Abstract: 本发明提供一种图像生成方法、图像去噪模型的训练方法和设备,涉及图像生成技术领域,解决了如何生成与引导信息的信息内容相匹配的目标无噪声图像的问题。该方法包括:先获取待处理的噪声图像、噪声图像对应的引导信息、目标加噪阶段和空引导信息;引导信息包括语义轮廓图像,或者,包括语义轮廓图像和目标文本;并基于噪声图像、引导信息、目标加噪阶段及空引导信息,对噪声图像进行去噪处理,生成目标无噪声图像;其中,目标无噪声图像的图像内容与引导信息的信息内容的匹配度大于第一阈值。这样结合引导信息和空引导信息对噪声图像进行去噪处理,可以生成与引导信息的信息内容相匹配的目标无噪声图像,提高了生成的目标无噪声图像的准确度。

    基于一致性损失的细粒度图像模型训练及识别方法和装置

    公开(公告)号:CN114821203A

    公开(公告)日:2022-07-29

    申请号:CN202210745986.X

    申请日:2022-06-29

    Abstract: 本申请提供一种基于一致性损失的细粒度图像模型训练及识别方法和装置,涉及图像处理领域,该方法包括:获取样本图像对应的变换图像;将所述样本图像输入至图像识别模型,得到所述样本图像对应的第一行向量和第一列向量;将所述变换图像输入至所述图像识别模型,得到所述变换图像对应的第二行向量和第二列向量;根据所述第一行向量、所述第一列向量、所述第二行向量、所述第二列向量和所述样本图像的标注类别,对所述图像识别模型的参数进行调整。提高了图像识别模型的鲁棒性,以及图像识别模型对于图像的识别准确率。

    图像生成器的训练方法、装置、电子设备和可读存储介质

    公开(公告)号:CN114782291A

    公开(公告)日:2022-07-22

    申请号:CN202210715667.4

    申请日:2022-06-23

    Abstract: 本发明提供一种图像生成器的训练方法、装置、电子设备和可读存储介质,涉及图像处理技术领域,通过将降质样本人脸图像输入至图像生成器中得到修复样本人脸图像,图像生成器基于Transformer模型构建;基于原始样本人脸图像和修复样本人脸图像对图像判别器以及图像生成器进行优化;重复优化图像判别器以及优化图像生成器的步骤,直至达到预设收敛条件,以通过优化后的图像生成器对待修复人脸图像进行图像盲修复处理,实现了端对端的图像盲修复功能,训练过程不需要人工干预,训练路径比较简单,克服了现有技术中单个阶段无法获得理想的训练结果、训练过程需要人工干预和训练路径繁琐复杂的缺陷。

    图像扫描识别方法、装置及电子设备

    公开(公告)号:CN114429636B

    公开(公告)日:2022-07-12

    申请号:CN202210353468.3

    申请日:2022-04-06

    Abstract: 本发明提供一种图像扫描识别方法、装置及电子设备,该方法包括:对于当前次迭代,根据掩码区域,与下一帧局部图片进行图像块匹配后进行图像拼接同时更新下次迭代需要的掩码区域;最初掩码区域是基于对初始帧局部图片进行文本检测的结果获取的;对于拼接后的整体图片,若满足预设条件,则进行文本检测,并在文本检测结果满足预设识别条件的情况下,对拼接图片进行文本识别;继续执行下一次迭代,直到扫描笔停止扫描;根据每次迭代过程中得到的拼接图片的文本识别结果,获取扫描笔的图像扫描结果。本发明实现在计算资源和存储资源受限的低配置设备上达到良好实时性的同时,提高了图像拼接和识别的效率和精度。

Patent Agency Ranking