多模态数据集的构建方法、装置及存储介质

    公开(公告)号:CN118606712A

    公开(公告)日:2024-09-06

    申请号:CN202410793274.4

    申请日:2024-06-19

    Abstract: 本申请提供一种多模态数据集构建方法、装置及存储介质。首先清洗出高质量图片;然后对高质量的图片生成图片的描述;评估生成的描述与图片的相似度,如果相似度较低,重新生成图片的描述,直到生成的描述与图片的相似度达到规定的得分;使用音频模型,把生成的图片描述转换成语音,通过评分模型打分,得到满足条件的音频;得到图‑文‑音三模态高质量数据集。通过本发明的获取数据集的方法,获取了高质量的图文音数据集,可以用来提高模型的泛化能力。

    基于稀疏标记物的图像矫正方法、装置及存储介质

    公开(公告)号:CN117853382A

    公开(公告)日:2024-04-09

    申请号:CN202410242270.7

    申请日:2024-03-04

    Abstract: 本申请提供一种基于稀疏标记物的图像矫正方法、装置及存储介质,涉及计算机视觉技术领域。该方法包括:获取待处理图像中的标记物的位置信息;基于预定义几何约束和所述标记物的位置信息获取所述标记物的位置偏移量;基于所述标记物的位置偏移量对所述待处理图像进行正射矫正。本申请提供的基于稀疏标记物的图像矫正方法、装置及存储介质,利用了标记物的几何特点来获取对应标记物的位置偏移量,使基于随意摆放的小型标记物便能实现图像矫正,增强了操作的便利性和灵活性,提升了用户体验。

    虚拟试穿方法、装置、电子设备及存储介质

    公开(公告)号:CN117575746A

    公开(公告)日:2024-02-20

    申请号:CN202410068912.6

    申请日:2024-01-17

    Abstract: 本发明提供一种虚拟试穿方法、装置、电子设备及存储介质,属于图像处理技术领域,所述方法包括:获取待试穿衣物图像和人物图像;将所述待试穿衣物图像和所述人物图像输入至虚拟试穿模型,得到所述虚拟试穿模型输出的虚拟试穿图像;所述虚拟试穿模型是根据人物图像样本、衣物图像样本和虚拟试穿图像的伪标签训练得到的,所述伪标签是利用多个有解析器生成模型对人物图像数据集、衣物图像数据集以及所述人物图像数据集中各人物图像的解析数据进行处理得到的。本发明可以实现无解析器形式的虚拟试穿图像生成,有效提高了虚拟试穿图像的生成效率,提升了虚拟试穿效果。

    虚拟试穿方法、装置、电子设备及存储介质

    公开(公告)号:CN117575746B

    公开(公告)日:2024-04-16

    申请号:CN202410068912.6

    申请日:2024-01-17

    Abstract: 本发明提供一种虚拟试穿方法、装置、电子设备及存储介质,属于图像处理技术领域,所述方法包括:获取待试穿衣物图像和人物图像;将所述待试穿衣物图像和所述人物图像输入至虚拟试穿模型,得到所述虚拟试穿模型输出的虚拟试穿图像;所述虚拟试穿模型是根据人物图像样本、衣物图像样本和虚拟试穿图像的伪标签训练得到的,所述伪标签是利用多个有解析器生成模型对人物图像数据集、衣物图像数据集以及所述人物图像数据集中各人物图像的解析数据进行处理得到的。本发明可以实现无解析器形式的虚拟试穿图像生成,有效提高了虚拟试穿图像的生成效率,提升了虚拟试穿效果。

    一种基于大语言模型上下文压缩的长文本生成方法

    公开(公告)号:CN119761306A

    公开(公告)日:2025-04-04

    申请号:CN202411564900.9

    申请日:2024-11-05

    Abstract: 本发明提供一种基于大语言模型上下文压缩的长文本生成方法,方法包括:获取待压缩的上下文文本以及提示词文本,并进行基于压缩的编码处理,得到对应的压缩向量以及提示词嵌入向量;将压缩向量与提示词嵌入向量进行拼接,并对拼接得到的融合特征进行基于自回归的解码处理,得到对应的多个token标识符;根据预设的词表,将token标识符逐一地映射为文本字符串,并将文本字符串组成为压缩上下文文本。通过本申请,将大语言模型处理的上下文长文本进行压缩,解决现有技术中语义模型处理长上下文文本时需要消耗巨大的模型计算资源和数据存储资源的技术问题。

    服饰编辑模型构建方法、编辑方法、装置、设备、介质和产品

    公开(公告)号:CN118096944A

    公开(公告)日:2024-05-28

    申请号:CN202410495172.4

    申请日:2024-04-24

    Abstract: 本发明涉及计算机视觉技术领域,提供一种服饰编辑模型构建方法、编辑方法、装置、设备、介质和产品,构建方法包括:确定初始模型、原始样本图像和引导提示,引导提示表征各类别服饰的服饰特征;基于原始样本图像包含的服饰类别,对原始样本图像进行服饰特征去除,得到无服饰特征图;基于无服饰特征图和引导提示,对初始模型进行参数迭代,得到服饰编辑模型,服饰编辑模型用于对待编辑图像中各类服饰进行编辑。本发明提供的服饰编辑模型构建方法、编辑方法、装置、设备、介质和产品,能够针对人物图像中各种类别的服饰进行编辑,从而提高用户体验感和满意度。

Patent Agency Ranking