透明视频的生成方法、装置、电子设备、存储介质和计算机程序产品

    公开(公告)号:CN119629433A

    公开(公告)日:2025-03-14

    申请号:CN202411708685.5

    申请日:2024-11-26

    Inventor: 雷震 杨阳 白景琦

    Abstract: 本公开关于透明视频的生成方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:获取RGB视频序列和掩码图片序列;针对RGB视频序列所包含的除目标RGB图片之外的其他图片进行加噪;将加噪后的RGB视频序列和掩码图片序列输入透明编码器;将加噪后的RGB视频序列输入VAE编码器,获得RGB潜特征矩阵;计算第一透明潜特征矩阵和RGB潜特征矩阵的加和矩阵,并将加和矩阵输入扩散模型;基于中间加和元素(Xm)和其他加和元素(Xi),生成透明视频。这样,本公开可以使用中间帧注意力机制为透明视频的生成过程提供先验信息,进而可以将视频帧内的内容信息、透明信息与动作信息进行解耦,可以保证生成透明区域准确、无伪影的透明视频。

    基于单张图像的三维人体重建方法及相关设备

    公开(公告)号:CN117392326B

    公开(公告)日:2024-09-20

    申请号:CN202311490396.8

    申请日:2023-11-09

    Abstract: 本发明提供一种基于单张图像的三维人体重建方法及相关设备,涉及图像处理技术领域,所述方法包括:将单张人体图像输入全局编码器,获取第一身体参数和全局二维特征;将第一手部特征、第一头部特征以及单张人体图像输入局部解码器,获取第一手部参数和第一头部参数;第一手部特征和所述第一头部特征是从全局二维特征中分离出来的;将第一身体参数、第一手部参数和第一头部参数输入部件交互模块进行部件交互,得到三维人体重建结果;部件交互模块用于基于第一身体参数、第一手部参数和第一头部参数进行身体、手部和头部之间的信息交互,以调整第一身体参数、第一手部参数和第一头部参数。本发明提高了三维人体重建结果的精度。

    一种应用于自然图像的处理模型的搭建方法及装置

    公开(公告)号:CN113627434B

    公开(公告)日:2024-05-28

    申请号:CN202110767565.2

    申请日:2021-07-07

    Abstract: 本发明提供一种应用于自然图像的处理模型的搭建方法及装置,涉及深度学习技术领域,该方法包括以下步骤:采集自然图像,得到样本图像,并将样本图像作为数据集;对数据集进行分割,得到训练集和测试集;其中,训练集和测试集的交集为空集;为训练集补充三维信息,将二维图像数据映射成三维点云数据后作为训练使用的输入数据,采用深度学习方式进行训练,得到用于生成待识别自然图像的分类结果的处理模型,本发明通过为二维图像还原其三维原型来扩大特征嵌入空间,以同时结合全局和局部的特征进行快速的少样本学习和预测,可以在只有少量数据的情况下快速学习和预测,并且能结合多种的特征的特点,能更好地运用在自然图像分类方面。

    一种小鼠行为量化分析方法、装置、设备及可读存储介质

    公开(公告)号:CN113627255B

    公开(公告)日:2024-05-24

    申请号:CN202110767576.0

    申请日:2021-07-07

    Inventor: 马喜波 李晗 雷震

    Abstract: 本发明提供一种小鼠行为量化分析方法、装置、设备及可读存储介质,涉及动物行为分析技术领域,该方法包括以下步骤:采集小鼠的待预测视频;将待预测视频输入至姿态估计网络模型中,得到姿态估计网络模型输出的小鼠对应的姿态估计结果;将待预测视频和姿态估计结果输入至行为检测网络模型中,得到行为检测模型输出的小鼠对应的行为检测结果;基于姿态估计结果与行为检测结果提取小鼠的行为模式特征,根据行为模式特征对小鼠的行为进行量化分析。本发明基于动物姿态估计与行为检测提取多种小鼠行为模式特征,有利于实现更加准确与可靠的小鼠行为量化分析。

    基于SlowFast的行为识别方法、系统及设备

    公开(公告)号:CN113723169B

    公开(公告)日:2024-04-30

    申请号:CN202110455595.X

    申请日:2021-04-26

    Inventor: 马喜波 徐哲 雷震

    Abstract: 本发明属于行为识别技术领域,具体涉及了一种基于SlowFast的行为识别方法、系统及设备装置,旨在解决识别效率低以及识别精度低的问题。方法包括:对目标行为原始视频数据进行预处理得到预处理视频数据;将预处理视频数据划分为训练数据集和验证数据集;将训练数据集输入至预先构建的第一SlowFast神经网络识别模型中进行初步训练,得到第二SlowFast神经网络识别模型;根据验证数据集计算第二SlowFast神经网络识别模型的识别精度;根据识别精度调整第二SlowFast神经网络识别模型的参数,并进行迭代训练,得到第三SlowFast神经网络识别模型;利用第三SlowFast神经网络识别模型识别真实环境中的目标行为。本发明大大提高了识别效率,节省了人力和时间,并提高了识别精度。

    文本生成图像的方法及装置
    7.
    发明公开

    公开(公告)号:CN117593419A

    公开(公告)日:2024-02-23

    申请号:CN202311352266.8

    申请日:2023-10-18

    Abstract: 本发明提供一种文本生成图像的方法及装置,该方法包括:确定输入的第一文本描述中的各概念在文本生成图像模型生成的图像中对应的预测位置框,所述文本生成图像模型根据第二噪声图像、第二文本描述和输入的参考图像,基于文本反转方法训练得到,所述第一文本描述和所述第二文本描述中包括目标概念,所述参考图像包括所述目标概念的对象;将第一噪声图像和第一文本描述输入文本生成图像模型,根据文本生成图像模型对第一噪声图像每次去噪后的图像确定各概念的注意力图,根据各概念的注意力图在各概念对应的预测位置框上的聚集损失对去噪后的图像进行再次去噪,直到满足预设条件。本发明实现生成图像中不丢失其他概念的对象。

    一种人脸图像识别方法、系统、电子设备及存储介质

    公开(公告)号:CN116311429A

    公开(公告)日:2023-06-23

    申请号:CN202310148954.6

    申请日:2023-02-14

    Inventor: 朱翔昱 雷震 于畅

    Abstract: 本发明提供一种人脸图像识别方法、系统、电子设备及存储介质,方法包括:将预设的待识别人脸图像输入预设的逆图形胶囊网络,进行图像编码,获取全局形状特征与全局纹理特征;基于预设的图像分解规则,对全局形状特征与全局纹理特征分别进行特征分解,获取部件级别的胶囊特征;对胶囊特征进行图形解码,获取至少一个部件胶囊;基于描述参数中的深度信息,对每个部件胶囊分别进行信息融合,获取至少一个目标胶囊;根据预先获取的待识别人脸图像中各人脸部件的光照值,对目标胶囊进行渲染,获取最终人脸图像,最终人脸图像包括人脸的三维描述信息。有效提升逆图形胶囊网络的可解释性和应用范围,能够较好地识别或处理较大姿态人脸。

    基于单张源域样本的新场景人脸识别模型构建方法、系统

    公开(公告)号:CN112329617B

    公开(公告)日:2022-10-21

    申请号:CN202011216042.0

    申请日:2020-11-04

    Inventor: 雷震 朱翔昱 刘浩

    Abstract: 本发明提供了一种基于单张源域样本的新场景人脸识别模型构建方法、系统。本发明方法包括:基于源域图像样本构成的第一样本集训练人脸识别模型得到第一模型;基于第一模型对第一样本集进行样本特征提取,对各类样本分别基于距离其类别中心的预设距离选取一个源域图像样本作为保留样本加入目标域样本集,得到第二样本集;基于第一模型对第二样本集中各样本进行特征提取,分别计算第二样本集中各类样本的类别特征模板,并扩展到第一模型的分类层中,得到第二模型;基于第二样本集,通过硬标签和软标签的共同约束训练第二模型,得到新场景人脸识别模型。本发明解决了人脸识别方法在应对新场景数据时存在的灾难性遗忘性问题,并减少了训练时间。

Patent Agency Ranking