-
公开(公告)号:CN115063843A
公开(公告)日:2022-09-16
申请号:CN202210552231.8
申请日:2022-05-20
Applicant: 华南理工大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/14 , G06V10/82 , G06V10/764 , G06V10/40 , G06T5/30 , G06T3/00 , G06N3/08 , G06N3/04 , H04L9/32
Abstract: 本发明公开了一种面向高自由度应用场景的掌脉数据增强及特征提取方法,包括以下步骤:S1、对训练数据的进行数据扩增,包括基于仿射变换的数据扩增、基于伽马变换的数据扩增、基于主纹理淡化算法的数据扩增、约束性数据扩增方案;在数据完成扩增后,将灰度值划分为四个灰度等级;S2、构建基于对比学习的掌脉图像特征提取网络,并对所述特征提取网络进行训练优化;S3、将图像输入训练好的基于对比学习的掌脉图像特征提取网络中进行特征提取。
-
公开(公告)号:CN115063843B
公开(公告)日:2024-03-29
申请号:CN202210552231.8
申请日:2022-05-20
Applicant: 华南理工大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/14 , G06V10/82 , G06V10/764 , G06V10/40 , G06T5/30 , G06T3/02 , G06N3/0464 , G06N3/088 , H04L9/32
Abstract: 本发明公开了一种面向高自由度应用场景的掌脉数据增强及特征提取方法,包括以下步骤:S1、对训练数据的进行数据扩增,包括基于仿射变换的数据扩增、基于伽马变换的数据扩增、基于主纹理淡化算法的数据扩增、约束性数据扩增方案;在数据完成扩增后,将灰度值划分为四个灰度等级;S2、构建基于对比学习的掌脉图像特征提取网络,并对所述特征提取网络进行训练优化;S3、将图像输入训练好的基于对比学习的掌脉图像特征提取网络中进行特征提取。
-
公开(公告)号:CN117437658A
公开(公告)日:2024-01-23
申请号:CN202311180603.X
申请日:2023-09-13
Applicant: 华南理工大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/12 , G06V40/14 , G06V10/28 , G06V10/44 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种解耦掌形和掌静脉的显式融合的身份识别方法,包括以下步骤:使用掌静脉数据集来训练基于语义分割的手掌前景分割模型;采集近红外掌静脉图像;使用手掌前景分割模型,在采集到的单张近红外掌静脉图片上进行分割,提取手掌二值化掩膜,对分割二值化掩膜处理后得到的二值化图片;根据手掌二值化掩膜中的手掌关键点,对掌静脉图像进行感兴趣区域截取,得到掌静脉模态;结合传统图像处理方法获取手掌的轮廓形状,并根据手掌姿态对其进行旋转矫正和裁剪,得到掌形二值化图片,作为掌形模态;将掌形模态和掌静脉模态输入到掌形掌静脉融合特征提取模型,输出融合掌形和掌静脉信息的统一高维特征,以实现模态信息的互补效果。
-
公开(公告)号:CN119692410A
公开(公告)日:2025-03-25
申请号:CN202311248206.1
申请日:2023-09-25
Applicant: 杭州海康威视数字技术股份有限公司 , 华中科技大学
Abstract: 本申请实施例提供一种模型训练方法、装置及终端设备。该方法包括:确定初始模型,所述初始模型中包括多个神经元,所述初始模型用于对输入数据进行处理得到标签数据;获取多个输入数据;确定各神经元的安全阈值和激活函数参数;根据所述多个输入数据、以及所述各神经元的安全阈值和激活函数参数,确定各神经元的权重值,以得到目标模型;所述目标模型用于对所述输入数据进行处理得到输出数据,所述输出数据为对所述标签数据进行脱敏处理后的数据。提高了模型训练的安全性。
-
公开(公告)号:CN109919296B
公开(公告)日:2025-02-14
申请号:CN201711319390.9
申请日:2017-12-12
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/08 , G06N3/045 , G06F18/2431
Abstract: 本发明实施例提供了一种深度神经网络训练方法、装置及计算机设备,其中,深度神经网络训练方法包括:针对树状网络拓扑结构中的当前网络层,获取当前网络层中各节点的任务属性,其中,树状网络拓扑结构中的各节点为对应于不同任务的神经网络,树状网络拓扑结构中的叶节点为针对指定任务已完成训练的神经网络;基于当前网络层中各节点的任务属性,对当前网络层中各节点进行聚类分析,提取同一类别中多个节点的任务属性的共性部分,作为多个节点的父节点的任务属性;基于各父节点的任务属性,训练各父节点的网络参数;在对各网络层中各节点完成训练后,确定树状网络拓扑结构对应的深度神经网络训练结束。通过本方案可以提高深度学习的运算效率。
-
公开(公告)号:CN119107515A
公开(公告)日:2024-12-10
申请号:CN202310679021.X
申请日:2023-06-08
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/774 , G06V40/16
Abstract: 本申请提供一种面部运动单元检测方法、装置及设备,该方法包括:将源域图像输入给检测网络得到源域特征,将源域特征输入给第一分类器得到源域预测向量;将目标域图像输入给检测网络得到目标域特征,将目标域特征输入给第一分类器得到目标域预测向量;基于源域预测向量确定源域分布向量,基于目标域预测向量确定目标域分布向量;将源域分布向量输入给第二分类器得到第一分类结果,将目标域分布向量输入给第二分类器得到第二分类结果,基于第一分类结果和第二分类结果确定第一损失值,基于第一损失值对检测网络和第一分类器的网络参数进行调整,基于调整后的检测网络和第一分类器生成目标网络模型。通过本申请方案,训练时间较短,资源消耗较小。
-
公开(公告)号:CN118736371A
公开(公告)日:2024-10-01
申请号:CN202310360225.7
申请日:2023-03-31
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种物料数量确定方法、装置及设备,包括:将物料盘对应的待检测图像输入给目标网络模型,得到待检测图像对应的置信度图像,置信度图像中像素点的像素值表示该像素点对应位置是物料中心点的概率;待检测图像包括至少一个物料分盘的图像,置信度图像包括每个物料分盘对应的分盘区域图像;针对每个物料分盘,基于物料分盘对应的池化核尺寸对物料分盘对应的分盘区域图像进行池化,得到物料分盘对应的池化图像;基于池化图像和分盘区域图像生成物料分盘对应的输出概率图;确定输出概率图中的像素值符合物料决策条件的像素点数量,基于像素点数量确定物料分盘对应的物料数量。通过本申请方案,能够准确统计物料数量,避免物料数量统计错误。
-
公开(公告)号:CN118278485A
公开(公告)日:2024-07-02
申请号:CN202211734115.4
申请日:2022-12-30
Applicant: 杭州海康威视数字技术股份有限公司 , 华中科技大学
Abstract: 本发明实施例提供了一种神经网络模型压缩、图像处理方法及装置,涉及人工智能技术领域,所述方法包括:基于表征待压缩模型中各网络层内神经元的输入图像数据和输出图像数据间映射关系的激活函数,获得各网络层对应的NTK特征谱的第一表征信息;获得各网络层中神经元按照对应的分段多值化映射关系进行数据转换时对应的NTK特征谱的第二表征信息;确定使得各网络层对应的第二表征信息与第一表征信息相同时各网络层对应的分段多值化映射关系的参数值;按照确定参数值后的映射关系更新各网络层对应的激活函数,得到用于进行图像处理的压缩后模型。应用本发明实施例提供的神经网络模型压缩方法,能够实现对应用于图像处理的神经网络模型进行压缩。
-
公开(公告)号:CN118057409A
公开(公告)日:2024-05-21
申请号:CN202211462155.8
申请日:2022-11-21
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/0442 , G10L15/16 , G06N3/049 , G06N3/08
Abstract: 本申请提供一种音视频识别方法、装置、电子设备及脉冲相机,该方法包括:获取待识别音视频数据的脉冲序列,并对所述待识别音视频数据的脉冲序列进行分段,得到多个音视频脉冲片段;将所述多个音视频脉冲片段输入循环脉冲神经网络,利用所述循环脉冲神经网络对所述多个音视频脉冲片段进行推理;对所述循环脉冲神经网络的输出进行脉冲解码,并依据解码结果确定所述待识别音视频数据的识别结果。该方法可以降低音视频识别的功耗,扩展音视频识别的适用场景。
-
公开(公告)号:CN117671751A
公开(公告)日:2024-03-08
申请号:CN202210977193.0
申请日:2022-08-15
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V40/16 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本申请实施例提供了一种人脸识别方法、系统及装置,涉及图像处理技术领域,方法包括:获取待识别人脸图像;按照预设区域确定方式,从待识别人脸图像中确定目标用户的注视点所属的图像区域,作为待识别注视区域;基于待识别人脸图像和待识别注视区域进行特征提取,得到待识别人脸特征;将待识别人脸特征与预设人脸特征进行比对,得到待识别人脸图像的识别结果。应用本申请实施例,能够提高人脸识别的可靠性。
-
-
-
-
-
-
-
-
-