-
公开(公告)号:CN118799204B
公开(公告)日:2024-12-27
申请号:CN202411276518.8
申请日:2024-09-12
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
Abstract: 本发明涉及一种夜间可见光与热红外图像融合方法,属于图像处理领域。本发明基于图像分层理论,运用加权引导滤波和高斯滤波组合策略,分别将夜间可见光图像和热红外图像分解为基本、边缘和纹理层;然后提出基于视觉亮度感知特性的分层互补融合方法将夜间可见光图像和热红外图像的基本层、纹理层和边缘层进行融合重构。该方法不仅保留了可见光图像的自然色彩和纹理细节,同时融合了热红外图像的热辐射信息,显著提升了目标的显著性和图像的整体质量。
-
公开(公告)号:CN118747905A
公开(公告)日:2024-10-08
申请号:CN202410741638.4
申请日:2024-06-09
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/10 , G06V10/44 , G06N3/0464 , G06V10/80 , G06N3/0895 , G06V10/764
Abstract: 行人属性识别(PAR)旨在生成行人的结构化描述,并在监控中具有重要意义。现有方法主要致力于训练过程中提升属性的空间定位。然而,这些方法未能解决数据集中单一视角姿态与现实中遇到的复杂视角姿态之间的差异,导致在开放环境中属性定位效果不佳。因此,本文介绍了一种新的多视角PAR方法,该方法使用人体关键点信息来适应复杂视角姿态。该方法利用关键点来建模属性特征的空间分布,便于进行弱监督定位,以模拟属性与人体在复杂视角下的动态关系。此外,它还结合了空间位置编码来建模人体结构信息,并隐式捕捉属性与人体之间的关系。最后我们应用了特征融合的方法使得空间位置信息发挥更大的作用。
-
公开(公告)号:CN119091467A
公开(公告)日:2024-12-06
申请号:CN202411275283.0
申请日:2024-09-12
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
Abstract: 本发明涉及一种基于主体目标判别的遮挡行人再识别方法,属于计算机视觉技术领域。本发明首先获取行人抓拍切片,对所述行人抓拍切片进行人体实例分割,得到分割掩码集合;然后对集合中各掩码打分,根据掩码分值确定当前行人抓拍切片的主体目标分割掩码;最后基于主体目标分割掩码识别被遮挡行人。本发明能够准确判别主体目标,并基于主体目标对遮挡行人切片进行图像级别的干扰信息过滤,从而有效缓解图片中的背景和非目标行人对主体目标特征学习的干扰,提升行人再识别模型在遮挡情况下的关联准确率。
-
公开(公告)号:CN118799204A
公开(公告)日:2024-10-18
申请号:CN202411276518.8
申请日:2024-09-12
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
Abstract: 本发明涉及一种夜间可见光与热红外图像融合方法,属于图像处理领域。本发明基于图像分层理论,运用加权引导滤波和高斯滤波组合策略,分别将夜间可见光图像和热红外图像分解为基本、边缘和纹理层;然后提出基于视觉亮度感知特性的分层互补融合方法将夜间可见光图像和热红外图像的基本层、纹理层和边缘层进行融合重构。该方法不仅保留了可见光图像的自然色彩和纹理细节,同时融合了热红外图像的热辐射信息,显著提升了目标的显著性和图像的整体质量。
-
公开(公告)号:CN117115851A
公开(公告)日:2023-11-24
申请号:CN202310608449.5
申请日:2023-05-27
Applicant: 北京航空航天大学 , 杭州海康威视数字技术股份有限公司
IPC: G06V40/10 , G06V20/52 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 一种在监控场景下,基于去除深度模型在推理过程中学习到的冗余属性间共现偏置,以实现在变化场景下更好泛化性能的行人属性识别方法。包括:一种新的属性信息解耦特征的生成方式。在模型对某一属性的识别和推理过程中,利用特征的线性插值与标签的线性插值匹配这一先前研究中的实验观察,通过最小化该属性的特化特征与其他属性预测概率间的互信息,以减少对于其他属性信息的利用,在显著降低训练时间的前提下实现了更好的准确率;一种新的特征插值方法。本发明提出了方向‑范数分离的特征插值方法,该方法相比于原始的插值过程,可以更好地发掘与探索属性特征的分布域,进而提高了模型的最终效果;使用卷积神经网络,按照以上算法框架,以特定训练参数配置对模型进行训练,得到行人属性识别模型。本方法可以实现在发生时空变化的监控场景中更加精确和稳定的行人属性识别结果。
-
公开(公告)号:CN119291034A
公开(公告)日:2025-01-10
申请号:CN202411538473.7
申请日:2024-10-31
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请实施例提供一种焊接缺陷检测方法、装置、系统、计算机设备,涉及超声检测技术领域。该方法包括获取多层焊接件对应的三维扫描数据;从三维扫描数据中切取XZ维度的B扫描图像,对B扫描图像进行处理得到Z维度的一维数据;根据Z维度的一维数据中的峰值确定多层焊接件的各个焊缝层的焊缝位置;根据各焊缝层的焊缝位置从三维扫描数据中获取各焊缝层对应的C扫描数据,并根据各焊缝层对应的C扫描数据检测各焊缝层是否存在焊接缺陷。该过程中充分利用了三维扫描数据中所有采集数据的信息,使得确定的焊缝位置的准确度更高,这样基于焊缝位置提取的C扫描数据更能准确反映焊缝的焊接质量,从而提高了焊接缺陷的检测结果。
-
公开(公告)号:CN115062765A
公开(公告)日:2022-09-16
申请号:CN202210709171.6
申请日:2022-06-21
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请提供一种任务处理方法、装置、电子设备及存储介质,该方法包括:在对Transformer模型进行训练的过程中,对于Transformer模型中的任一归一化层,确定该归一化层当前批次的第一统计值,依据该第一统计值以及该归一化层历史批次的统计值,利用滑动平均策略,对该第一统计值进行平滑处理,得到第二统计值,并利用将该归一化层的第二统计值进行前向或反向传播;在利用训练好的Transformer模型进行任务处理的过程中,对于Transformer模型中的任一归一化层,将该归一化层的统计值固定为第三统计值进行推理计算。该方法可以在降低Transformer模型的计算内存消耗的情况下,保证处理性能。
-
公开(公告)号:CN119358691A
公开(公告)日:2025-01-24
申请号:CN202411909532.7
申请日:2024-12-24
Applicant: 杭州海康威视数字技术股份有限公司
Abstract: 本申请公开了一种基于大模型的推理方法及相关设备,涉及人工智能技术领域,包括:响应于推理指令,获取场景图片数据,基于预设大语言模型相应粒度的量化方式,对所述场景图片数据执行量化操作,得到目标图像数据,基于更改部署方式后的所述预设大语言模型的推理量化流程,对所述目标图像数据进行推理量化,得到推理量化结果,其中,所述更改部署方式后所对应的推理量化流程比更改部署方式前推理量化流程的计算量更小。本申请使用计算量更小的推理量化流程所对应的部署方式部署预设大语言模型,减少推理量化过程中的计算量,提高推理效率。
-
公开(公告)号:CN118710889B
公开(公告)日:2024-12-03
申请号:CN202411184316.0
申请日:2024-08-27
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G06V10/25 , G06V20/62 , G06N3/0985 , G06N3/0895 , G06N3/045 , G06V10/774 , G06V10/82 , G06V10/80 , G06V10/776
Abstract: 本申请实施例提供了一种数据增强模型的训练方法、数据增强方法、及装置,涉及机器学习技术领域,该数据增强模型的训练方法包括:获取训练图像;利用初始结构的数据增强模型生成每一训练图像的数据增强变量的变量值;利用每一训练图像的数据增强变量的变量值,对该训练图像中对象的检测框进行变换处理,得到第一检测框;基于测试图像中表示同一类别对象的检测框,与表示该同一类别对象的第一检测框之间几何特征的差异,确定模型损失值;基于模型损失值对初始结构的数据增强模型的模型参数进行调参,直至达到预设收敛条件,得到训练完成的数据增强模型。通过本方案能够省去由专业人员人工调节超参数的过程,降低人工成本。
-
公开(公告)号:CN119361006B
公开(公告)日:2025-04-25
申请号:CN202411900422.4
申请日:2024-12-23
Applicant: 杭州海康威视数字技术股份有限公司
IPC: G16C20/20 , G16C20/70 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/045 , G06N3/098
Abstract: 本申请公开了一种液体识别方法、装置、存储介质和电子设备,方法包括:获取检测物品通过X光照射后生成的高能图、低能图、原子序数图和RGB图;基于高能图、低能图、原子序数图和/或RGB图裁剪得到待检液体的背景区域图和至少一个混叠前景区域图;利用背景分析网络提取背景特征信息,利用混叠前景分析网络提取混叠前景特征信息;基于背景特征信息和混叠前景特征信息,利用第一减法网络分析背景对前景的干扰,基于分析结果和原子序数图,利用第一去混叠网络进行背景干扰剥离,得到前景特征信息;基于前景特征信息,利用第一成分分析网络确定液体成分。应用本申请,能够支持无遮挡和各种遮挡场景下的液体识别,提高液体识别检测的性能。
-
-
-
-
-
-
-
-
-