-
公开(公告)号:CN119830982A
公开(公告)日:2025-04-15
申请号:CN202411865347.2
申请日:2022-05-31
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N3/082 , G06N3/0464 , G06V10/82 , G06V10/764
Abstract: 本申请提供一种神经网络模型裁剪方法、装置、电子设备及存储介质,该方法包括:依据待裁剪神经网络模型的结构特性,将所述待裁剪神经网络模型划分为多个结构分组;依据对所述待裁剪神经网络模型进行裁剪前后的损失函数变化,确定对所述多个结构分组中各结构分组进行裁剪的目标裁剪率;其中,所述损失函数变化依据第一因子和第二因子确定,所述第一因子用于表征各结构分组中各个权重的重要性,所述第二因子用于表征不同结构分组之间的相互作用;依据所述目标裁剪率,分别对各结构分组进行裁剪,得到裁剪后的神经网络模型。该方法可以在较小性能损失的情况下加速压缩神经网络模型。
-
公开(公告)号:CN118781471A
公开(公告)日:2024-10-15
申请号:CN202411277658.7
申请日:2024-09-12
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/82 , G06V10/774 , G06V20/62 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种模型训练方法、对象识别方法、装置及电子设备,涉及深度学习技术领域,该模型训练方法包括:获取样本图像集;将各个样本图像输入对象识别模型,以使模型中的全局编码器对每一样本图像进行特征编码,得到初始图像特征,将每一样本图像的初始图像特征分别输入模型中的目标子网络、第一子网络以及第二子网络,得到各子网络针对每一样本图像的输出结果;基于子网络针对每一样本图像的输出结果以及各个样本图像的标定真值,确定子网络的网络损失;基于每一子网络的网络损失,确定模型损失;基于模型损失判断出对象识别模型未收敛,调整对象识别模型的网络参数,并返回获取样本图像集的步骤。通过本方案可以提高对象识别模型的准确性。
-
公开(公告)号:CN118747905A
公开(公告)日:2024-10-08
申请号:CN202410741638.4
申请日:2024-06-09
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/10 , G06V10/44 , G06N3/0464 , G06V10/80 , G06N3/0895 , G06V10/764
Abstract: 行人属性识别(PAR)旨在生成行人的结构化描述,并在监控中具有重要意义。现有方法主要致力于训练过程中提升属性的空间定位。然而,这些方法未能解决数据集中单一视角姿态与现实中遇到的复杂视角姿态之间的差异,导致在开放环境中属性定位效果不佳。因此,本文介绍了一种新的多视角PAR方法,该方法使用人体关键点信息来适应复杂视角姿态。该方法利用关键点来建模属性特征的空间分布,便于进行弱监督定位,以模拟属性与人体在复杂视角下的动态关系。此外,它还结合了空间位置编码来建模人体结构信息,并隐式捕捉属性与人体之间的关系。最后我们应用了特征融合的方法使得空间位置信息发挥更大的作用。
-
公开(公告)号:CN118397109B
公开(公告)日:2024-08-20
申请号:CN202410853898.0
申请日:2024-06-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种车载相机标定方法、装置、电子设备及机器可读存储介质,该方法包括:对于车载相机采集的图像中的任一标定物,对该标定物进行角点检测,并依据角点像素坐标以及角点标定物世界坐标,确定该车载相机的像素坐标系与该标定物的标定物世界坐标系之间的映射关系;依据该映射关系,确定各车载相机的基准标定物世界坐标,并确定车身指定位置的基准标定物世界坐标;对于任一车载相机,依据该车载相机视野范围内多个标定物的多个角点的车身世界坐标,对该车载相机进行外参标定,车身世界坐标为车身世界坐标系下的坐标,车身世界坐标系为以车身指定位置为原点的世界坐标系。该方法可以提高车载相机外参标定的准确性和效率。
-
公开(公告)号:CN118397109A
公开(公告)日:2024-07-26
申请号:CN202410853898.0
申请日:2024-06-27
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种车载相机标定方法、装置、电子设备及机器可读存储介质,该方法包括:对于车载相机采集的图像中的任一标定物,对该标定物进行角点检测,并依据角点像素坐标以及角点标定物世界坐标,确定该车载相机的像素坐标系与该标定物的标定物世界坐标系之间的映射关系;依据该映射关系,确定各车载相机的基准标定物世界坐标,并确定车身指定位置的基准标定物世界坐标;对于任一车载相机,依据该车载相机视野范围内多个标定物的多个角点的车身世界坐标,对该车载相机进行外参标定,车身世界坐标为车身世界坐标系下的坐标,车身世界坐标系为以车身指定位置为原点的世界坐标系。该方法可以提高车载相机外参标定的准确性和效率。
-
公开(公告)号:CN118396125A
公开(公告)日:2024-07-26
申请号:CN202410848459.0
申请日:2024-06-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06N5/04 , G06F16/583 , G06F18/22 , G06V20/50
Abstract: 本申请公开了一种智能巡店方法、装置、存储介质和电子设备,包括:基于采集的当前图像数据,利用多模态模型生成对应于所述图像数据的文本描述;将所述文本描述和巡检问题组成输入问题,利用针对所述巡店场景训练生成的场景大语言模型,对所述输入问题进行处理,生成对应所述输入问题的目标答案;基于所述目标答案进行问题上报和提醒;场景大语言模型是基于所述巡店场景的巡店规则在通用大语言模型基础上调优生成的,所述巡店规则至少包括开放性事件对应的规则。应用本申请,能够针对开放性事件实现远程智能巡检。
-
公开(公告)号:CN115062792A
公开(公告)日:2022-09-16
申请号:CN202210751469.3
申请日:2022-06-28
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种网络模型的训练方法、装置及设备,该方法包括:获取网络层对应的浮点型激活梯度值;对浮点型激活梯度值进行量化,得到定点型激活梯度值和激活值量化超参;浮点型激活梯度值包括多个浮点型数值,基于激活值量化超参确定每个浮点型数值对应的量化中间值;针对每个量化中间值,若量化中间值不大于预设阈值,确定量化中间值对应的概率向量,基于概率向量确定量化中间值对应的定点型数值;基于所有量化中间值对应的定点型数值生成定点型激活梯度值;基于定点型激活梯度值对网络层的初始模型权重进行调整,将调整后模型权重更新为网络层的初始模型权重。通过本申请技术方案,可以减轻运算复杂度,运算量较小,能够对训练过程进行加速。
-
公开(公告)号:CN120086600A
公开(公告)日:2025-06-03
申请号:CN202510582392.5
申请日:2025-05-06
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06F18/214 , G06F18/21 , G06F18/22 , G06N5/04 , G06N3/0455 , G06N3/08 , G06N3/092
Abstract: 本申请公开了一种多模态数据样本的生成方法及电子设备,涉及数据处理技术领域。该方法包括:将原始多模态数据输入LLM,基于prompt提示词获取原始多模态数据的工具调用指令,依据该工具调用指令在该提示词中添加工具描述词,依据该工具调用指令,选择调用的模型,执行该任务信息对应的任务,得到数据处理结果,通过该工具描述词中的验证方式,以及该工具描述词中的工具调用响应格式,对该数据处理结果进行数据验证,若数据验证成功,对该数据处理结果和原始多模态数据进行强化学习,生成增强的多模态数据样本,该方法克服无引导的LLM指令生成混乱、不合理的缺陷,提升多模态数据处理的准确性和效率。
-
公开(公告)号:CN119361006A
公开(公告)日:2025-01-24
申请号:CN202411900422.4
申请日:2024-12-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G16C20/20 , G16C20/70 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/045 , G06N3/098
Abstract: 本申请公开了一种液体识别方法、装置、存储介质和电子设备,方法包括:获取检测物品通过X光照射后生成的高能图、低能图、原子序数图和RGB图;基于高能图、低能图、原子序数图和/或RGB图裁剪得到待检液体的背景区域图和至少一个混叠前景区域图;利用背景分析网络提取背景特征信息,利用混叠前景分析网络提取混叠前景特征信息;基于背景特征信息和混叠前景特征信息,利用第一减法网络分析背景对前景的干扰,基于分析结果和原子序数图,利用第一去混叠网络进行背景干扰剥离,得到前景特征信息;基于前景特征信息,利用第一成分分析网络确定液体成分。应用本申请,能够支持无遮挡和各种遮挡场景下的液体识别,提高液体识别检测的性能。
-
公开(公告)号:CN118781471B
公开(公告)日:2024-12-03
申请号:CN202411277658.7
申请日:2024-09-12
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/82 , G06V10/774 , G06V20/62 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种模型训练方法、对象识别方法、装置及电子设备,涉及深度学习技术领域,该模型训练方法包括:获取样本图像集;将各个样本图像输入对象识别模型,以使模型中的全局编码器对每一样本图像进行特征编码,得到初始图像特征,将每一样本图像的初始图像特征分别输入模型中的目标子网络、第一子网络以及第二子网络,得到各子网络针对每一样本图像的输出结果;基于子网络针对每一样本图像的输出结果以及各个样本图像的标定真值,确定子网络的网络损失;基于每一子网络的网络损失,确定模型损失;基于模型损失判断出对象识别模型未收敛,调整对象识别模型的网络参数,并返回获取样本图像集的步骤。通过本方案可以提高对象识别模型的准确性。
-
-
-
-
-
-
-
-
-