计算机视觉CV模型训练方法、装置、电子设备和存储介质

    公开(公告)号:CN111738289B

    公开(公告)日:2024-05-14

    申请号:CN202010389080.X

    申请日:2020-05-09

    Inventor: 赖申其 柴振华

    Abstract: 本申请公开了一种计算机视觉CV模型训练方法、装置、电子设备和存储介质,所述方法包括:获取第一CV模型提取的训练图像的第一视觉特征,获取第二CV模型提取的训练图像的第二视觉特征;对各训练图像的第一视觉特征和第二视觉特征分别进行拆解,得到第一视觉特征的第一拆解特征和第二视觉特征的第二拆解特征;根据第一拆解特征生成表征训练图像间关系的监督信号,根据第二拆解特征生成表征图像间关系的学习信号;根据监督信号和学习信号确定第二CV模型的训练损失值,根据训练损失值对第二CV模型的参数进行优化。本申请可以得到更多监督信号,提高模型拟合效果,同时可以学到图像间更重要的关系,避免了一些不具有判别力的图像关系对模型精度的影响。

    视频摘要生成模型的训练方法、视频摘要生成方法及装置

    公开(公告)号:CN112231516B

    公开(公告)日:2024-02-27

    申请号:CN202011057685.5

    申请日:2020-09-29

    Abstract: 本申请公开了一种视频摘要生成模型的训练方法、视频摘要生成方法及装置,属于机器学习领域。该方法包括:获取视频样本,从视频样本中确定出至少两帧样本图像,每一帧样本图像标注有参考评分;调用视频摘要生成模型分别对每一帧样本图像进行时间特征与空间特征的混合自注意力学习,得到样本图像在时间与空间上的混合特征向量;调用视频摘要生成模型基于混合特征向量对样本图像进行评分,得到每一帧样本图像作为视频摘要的重要性评分;基于参考评分与重要性评分之间的学习损失更新视频摘要生成模型中的模型参数,最终得到训练完成的视频摘要生成模型。该方法使得模型能够更充分的捕捉视频的上下文信息,生成时序表达优秀的视频摘要。

    一种人脸图像处理方法及装置

    公开(公告)号:CN113887326B

    公开(公告)日:2023-07-25

    申请号:CN202111061581.6

    申请日:2021-09-10

    Abstract: 本说明书公开了一种人脸图像处理方法及装置,通过待处理人脸图像的姿态数据和关键点数据,确定待处理人脸图像的姿态数据对应的偏移角度,并根据该偏移角度,确定与该偏移角度负相关的处理强度,作为该待处理人脸图像的处理强度,进而根据该处理强度和确定出的关键点数据,对该待处理人脸图像进行调整。本方法通过确定与偏移角度负相关的处理强度,使得在对各帧人脸图像进行处理时,不会出现处理效果突然出现或消失的情况,图像处理结果较为连贯,图像处理效率更高。

    神经网络模型压缩方法、装置、电子设备及可读存储介质

    公开(公告)号:CN113011581B

    公开(公告)日:2023-04-07

    申请号:CN202110210314.4

    申请日:2021-02-23

    Abstract: 本发明公开了一种神经网络模型压缩方法、装置、电子设备及可读存储介质。其中,该方法包括:将待压缩神经网络输入至预先训练完成的压缩模型,其中,压缩模型包括通道剪枝模块以及自蒸馏量化模块;通过通道剪枝模块对待压缩神经网络进行通道剪枝操作,以得到第一输出;通过自蒸馏量化模块对第一输出进行自蒸馏量化操作,以得到目标神经网络。本发明解决了相关技术中压缩后的神经网络模型产生较大的精度损失的技术问题。

    一种模型压缩方法及装置
    35.
    发明公开

    公开(公告)号:CN113887719A

    公开(公告)日:2022-01-04

    申请号:CN202111067265.X

    申请日:2021-09-13

    Abstract: 本说明书公开了一种模型压缩方法及装置,可先获取已训练完成的神经网络模型,并针对该神经网络模型中的每个嵌入层,确定该嵌入层的嵌入矩阵以及该嵌入层的基准矩阵。之后,以该嵌入矩阵的行数与基准矩阵的行数为约束,构建索引矩阵,并基于该嵌入层的索引矩阵与基准矩阵,确定该嵌入层的重构矩阵。最后,以最小化该嵌入层的嵌入矩阵与重构矩阵之间的差异为目标,调整基准矩阵与索引矩阵中的参数,并基于调整后的各基准矩阵与各索引矩阵,确定压缩后的神经网络模型,用于部署至终端中执行业务。以模型中各嵌入层的嵌入矩阵与重构矩阵之间的差异为优化目标,得到各嵌入层压缩后的基准矩阵与索引矩阵,极大降低了模型压缩的数据量。

    一种图像生成方法、装置、存储介质及电子设备

    公开(公告)号:CN112950732A

    公开(公告)日:2021-06-11

    申请号:CN202110203197.9

    申请日:2021-02-23

    Abstract: 本说明书公开了一种图像生成方法、装置、存储介质及电子设备,本说明书实施例将获取到的指定非可见光人脸图像和指定可见光人脸图像输入预先训练的图像生成模型中,通过图像生成模型的第一模型提取指定非可见人脸图像的人脸语义特征,通过第二模型的环境特征编码器提取指定可见光人脸图像的环境特征。然后,通过第二模型的图像生成器,将人脸语义特征与环境特征进行融合,得到目标可见光人脸图像。在此方法中,可将人脸图像的特征分离成人脸语义特征和环境特征,然后,在根据所需人脸语义特征和所需环境特征生成指定人脸图像时,可以避免处于同一人脸图像中的这两种特征相互影响,从而提高了指定人脸图像的图像质量。

    人脸图像的合成方法、装置、电子设备及存储介质

    公开(公告)号:CN111738930A

    公开(公告)日:2020-10-02

    申请号:CN202010396641.9

    申请日:2020-05-12

    Abstract: 本申请公开了人脸图像的合成方法、装置、电子设备及存储介质。该方法通过获取基础人脸图像和遮挡物模板图像;根据基础人脸图像确定第一特征信息;根据第一特征信息和遮挡物模板图像的第二特征信息,确定遮挡物矫正参数;根据遮挡物矫正参数对遮挡物模板图像进行矫正,得到遮挡物矫正图像;对基础人脸图像和遮挡物矫正图像进行融合,得到人脸被遮挡物部分遮挡的合成图像。本申请根据基础人脸图像的特征对遮挡物模板图像进行调整,使得遮挡物模板图像能够与基础人脸的状态保持高度一致,合成效果更好,极大程度上提高了人脸的合成图像的鲁棒性,大幅度的减少了人工直接对被遮挡物部分遮挡的图像进行标注的工作量,显著提高了工作效率,且适用性广。

    图像识别方法、装置、存储介质及电子设备

    公开(公告)号:CN111507213A

    公开(公告)日:2020-08-07

    申请号:CN202010260389.9

    申请日:2020-04-03

    Inventor: 赖申其 柴振华

    Abstract: 本公开涉及一种图像识别方法、装置、存储介质及电子设备,所述方法包括:对获取到的图像序列中的每一图像进行重叠切分,得到对应该图像的多个切分图像;针对每一所述切分图像,通过注意力机制对所述切分图像的特征信息进行处理,并对处理后的特征矩阵进行最大池化处理,得到所述切分图像的特征信息;将每一所述特征信息输入到图像识别模型中,得到所述图像识别模型输出的识别结果,所述识别结果用于表征所述图像序列中具有相同对象的图像。

    身份验证方法、装置、电子设备和存储介质

    公开(公告)号:CN111428594A

    公开(公告)日:2020-07-17

    申请号:CN202010175937.8

    申请日:2020-03-13

    Inventor: 魏晓林 柴振华

    Abstract: 本申请公开了身份验证方法、装置、电子设备和存储介质。所述方法包括:获取用于身份验证的验证图像;从所述验证图像中识别出与身份相关的非生物特征;获取与所述非生物特征对应的待比对图像;根据所述验证图像与所述待比对图像确定身份验证结果。有益效果在于,利用与身份相关的非生物特征缩小了身份验证范围,将1:N的识别问题简化为1:1的验证问题,不仅提高了身份验证效率,减少了计算资源效果,适用于移动端等轻量化计算场景,而且也大大提升了身份验证的准确率,特别适合脸部戴有口罩等生物特征受到干扰的场景,同时利用计算机视觉的手段,不需要进行人体接触,在流行病高发时段降低了用户感染风险。

    目标区域的检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110490054A

    公开(公告)日:2019-11-22

    申请号:CN201910609918.9

    申请日:2019-07-08

    Abstract: 本公开的实施例提供了一种目标区域的检测方法、装置、电子设备及可读存储介质,所述方法包括:将目标图片输入至卷积层中,得到第一预测向量,卷积层由一个或多个低语义层的卷积核和一个或多个处于高语义层的卷积核连接组成;将低语义层的卷积核输出的第一预测向量输入至上下文敏感预测层,得到第二预测向量,上下文敏感预测层包括两个或以上预设卷积核的级联结构,预设卷积核在每个维度上的变量数目大于1;将高语义层的卷积核输出的第一预向量分别输入至代表特征提取层,得到第三预测向量,代表特征提取层仅包括一个预设卷积核;根据第二预测向量和第三预测向量确定目标区域。可以在高语义层采用有效降低网络结构的复杂度,以及避免过拟合现象。

Patent Agency Ranking