-
公开(公告)号:CN112200131B
公开(公告)日:2025-02-07
申请号:CN202011169031.1
申请日:2020-10-28
Applicant: 鹏城实验室
IPC: G06V20/52 , G06V10/25 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种基于视觉的车辆碰撞检测方法、智能终端及存储介质,所述方法包括:检测交通监控视频中的车辆,并通过矩形框框出交通监控视频中的车辆,输出车辆矩形边框和车辆编号;对检测出的车辆进行跟踪,判断车辆之间的车辆矩形边框是否出现重叠,并提取车辆的加速度、轨迹和方向变化;当车辆之间的车辆矩形边框出现重叠时,根据提取到的车辆的加速度、轨迹和方向变化得到异常指数,判断所述异常指数是否大于预设阈值;当所述异常指数大于预设阈值时,则判断为车辆碰撞事故。本发明综合考虑车辆在加速度异常、轨迹异常和方向异常三个方面的因素达到车辆碰撞事故检测的目的,能够快速和准确地检测出场景中的车辆碰撞事故。
-
公开(公告)号:CN118734976B
公开(公告)日:2024-12-17
申请号:CN202411224705.1
申请日:2024-09-03
Applicant: 鹏城实验室
IPC: G06N5/04 , G06N3/0464 , G06N3/08 , G06F18/25 , G06F40/30
Abstract: 本发明公开了一种基于梯度自校准的多模态预训练方法、系统、终端及存储介质,本发明利用混合模态交互网络,让针对于特定模态的与任务无关的损失函数来学习一个统一模态交互模块的梯度,根据不同模态梯度方向间的差异来确定哪些模态间的差异较小;使用这些差异较小的模态数据在共享编码器上面的组合梯度作为构建的正梯度方向,以该梯度方向来修正其余模态梯度的方向;根据修正后的模态梯度方向,将对应模态在该共享编码器上的参数在方向传播更新前,提前进行更新,从而达到平衡模态训练的目的,使用混合transformer网络结构来提取不同模态数据的融合特征,使用模态梯度自校准模块来修正不同模态针对联合编码器的梯度下降方向,提升不同模态融合表征的效果。
-
公开(公告)号:CN118734976A
公开(公告)日:2024-10-01
申请号:CN202411224705.1
申请日:2024-09-03
Applicant: 鹏城实验室
IPC: G06N5/04 , G06N3/0464 , G06N3/08 , G06F18/25 , G06F40/30
Abstract: 本发明公开了一种基于梯度自校准的多模态预训练方法、系统、终端及存储介质,本发明利用混合模态交互网络,让针对于特定模态的与任务无关的损失函数来学习一个统一模态交互模块的梯度,根据不同模态梯度方向间的差异来确定哪些模态间的差异较小;使用这些差异较小的模态数据在共享编码器上面的组合梯度作为构建的正梯度方向,以该梯度方向来修正其余模态梯度的方向;根据修正后的模态梯度方向,将对应模态在该共享编码器上的参数在方向传播更新前,提前进行更新,从而达到平衡模态训练的目的,使用混合transformer网络结构来提取不同模态数据的融合特征,使用模态梯度自校准模块来修正不同模态针对联合编码器的梯度下降方向,提升不同模态融合表征的效果。
-
公开(公告)号:CN118734091A
公开(公告)日:2024-10-01
申请号:CN202411220270.3
申请日:2024-09-02
Applicant: 鹏城实验室
IPC: G06F18/22 , G06N3/0455 , G06N3/096 , G06V10/26 , G06F40/284 , G06F18/27
Abstract: 本申请提供了一种基于掩码指代建模的视觉定位和指代分割方法、系统、设备以及存储介质,方法包括通过多模态编码器获得预训练图像与文本的视觉词元、聚合视觉词元、文本词元、聚合文本词元,并应用指代感知的动态图像掩码策略,基于文本指代的图像区域对预训练图像进行掩码,并根据视觉词元和聚合文本词元对掩码图像块以及视觉目标关联分数进行重建;应用指代感知的文本掩码策略,基于预训练文本的指代主语对预训练文本进行掩码,并根据文本词元和聚合视觉词元对掩码文本词以及语义目标关联分数进行重建,以使模型学习到通用的指代能力,进而可以使模型针对视觉定位和指代分割任务进行下游微调,以得到高精度的定位或者指代分割结果。
-
公开(公告)号:CN118570602A
公开(公告)日:2024-08-30
申请号:CN202410192487.1
申请日:2024-02-20
Applicant: 鹏城实验室
IPC: G06V10/82 , G06N3/045 , G06N3/096 , G06V10/764
Abstract: 本申请公开了图像分类网络生成方法、装置、电子设备及存储介质,涉及计算机技术领域。首先根据图像分类网络的网络参数生成搜索空间,从搜索空间中获取至少一个子网络,利用图像数据集和初始教师网络对子网络进行知识蒸馏,得到学生网络。然后根据学生网络的性能参数,从学生网络中选取教师网络,并将教师网络添加至教师网络队列中。利用教师网络队列对子网络进行知识蒸馏,直至得到满足预设性能参数的教师网络,将教师网络作为目标图像分类网络。由此基于初始教师网络和动态更新的教师网络队列,通过知识蒸馏技术使得子网络可以从多维度进行学习,从而极大地提升了模型的泛化能力,得到满足预设性能参数的目标图像分类网络。
-
公开(公告)号:CN112435276B
公开(公告)日:2024-08-23
申请号:CN202011272439.1
申请日:2020-11-13
Applicant: 鹏城实验室
Abstract: 本发明公开了一种车辆跟踪方法、装置、智能终端及存储介质,其中,上述车辆跟踪方法包括:获取包含车辆的连续视频帧;基于上述连续视频帧对上述车辆进行短期跟踪,获取短期跟踪结果;基于上述短期跟踪结果,对上述车辆进行轨迹预测,获取车辆轨迹信息;基于上述车辆轨迹信息获取可疑轨迹;获取上述可疑轨迹对应的可疑车辆,采用车辆重识别方案对上述可疑车辆进行外观特征匹配,获取外观匹配结果;基于上述可疑轨迹和上述外观匹配结果实现对车辆的跟踪。本发明方案结合短期跟踪、轨迹预测和外观特征匹配实现对车辆的跟踪。有利于提升跟踪的实时性、对长时间范围内的车辆进行跟踪、在车辆被遮挡前后连续跟踪。
-
公开(公告)号:CN118411563A
公开(公告)日:2024-07-30
申请号:CN202410544112.7
申请日:2024-04-30
IPC: G06V10/764 , G06V10/82 , G06V10/44 , G06V10/80 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本申请实施例提供了一种图像识别方法、装置、电子设备以及存储介质,属于计算机视觉技术领域。该方法包括:对获取到的待处理图像中的目标物体进行全局的特征提取,得到初始特征,将初始特征输入至预先训练好的图像识别模型中得到编码特征,基于特征增强后的初始特征和编码特征进行交叉融合处理,得到交叉融合特征;对编码特征进行动态位置查询,得到动态查询特征,并获取与动态查询特征相对应的静态查询特征;基于动态查询特征和静态查询特征对交叉融合特征进行解码,得到解码特征,并基于解码特征对待处理图像中的目标物体进行识别,得到目标识别结果。本申请能够提高对待处理图像中小目标物体的识别质量。
-
公开(公告)号:CN118097520B
公开(公告)日:2024-07-23
申请号:CN202410517099.6
申请日:2024-04-28
Applicant: 鹏城实验室
IPC: G06V20/40 , G06V10/40 , G06V10/764 , G06V10/74
Abstract: 本申请实施例提供了一种视觉识别模型测试时自适应方法、装置、设备及介质,属于计算机视觉技术领域。该方法包括:获取目标域不同模态下的多个第一视频片段和多个第二视频片段;通过第一视觉识别模型分别对多个第一视频片段进行视觉识别,得到对应的多个第一识别结果,综合多个第一识别结果建立不同模态下各个类别的伪源特征;通过第二视觉识别模型分别对多个第二视频片段进行视觉识别,得到对应的多个第二识别结果,综合多个第二识别结果建立不同模态下各个类别的目标特征;将目标特征与相同类别下的伪源特征进行特征对齐,并对第二视觉识别模型进行自适应调整,得到自适应调整后的第二视觉识别模型。本申请能够提高视觉识别模型识别的准确率。
-
公开(公告)号:CN117893766B
公开(公告)日:2024-07-02
申请号:CN202410272880.1
申请日:2024-03-11
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了物体检测分割方案,通过在训练物体检测分割模型的反向过程中,为预训练权重矩阵添加低秩矩阵作为训练参数,在维持特征提取网络深层的网络层组的预训练权重矩阵不变的情况下,先更新浅层的网络层组的低秩矩阵并维持浅层的网络层组的预训练权重矩阵不变,随后逐步增加网络层组,并在每次增加网络层组后重复更新低秩矩阵的过程,本申请通过层级解耦使得特征提取网络的学习率在不同适应阶段发生变化,避免了网络梯度从深层传播到浅层;利用层级结构逐步自适应预训练作为骨干的特征提取网络,能够更好地实现多级视觉表征的细粒度区域特征的感知,有利于在检测和分割任务上达到更加精准的性能。
-
公开(公告)号:CN117893766A
公开(公告)日:2024-04-16
申请号:CN202410272880.1
申请日:2024-03-11
Applicant: 鹏城实验室
Abstract: 本申请实施例提供了物体检测分割方案,通过在训练物体检测分割模型的反向过程中,为预训练权重矩阵添加低秩矩阵作为训练参数,在维持特征提取网络深层的网络层组的预训练权重矩阵不变的情况下,先更新浅层的网络层组的低秩矩阵并维持浅层的网络层组的预训练权重矩阵不变,随后逐步增加网络层组,并在每次增加网络层组后重复更新低秩矩阵的过程,本申请通过层级解耦使得特征提取网络的学习率在不同适应阶段发生变化,避免了网络梯度从深层传播到浅层;利用层级结构逐步自适应预训练作为骨干的特征提取网络,能够更好地实现多级视觉表征的细粒度区域特征的感知,有利于在检测和分割任务上达到更加精准的性能。
-
-
-
-
-
-
-
-
-