一种基于多源信息融合的轻量化车辆再辨识方法

    公开(公告)号:CN117456480B

    公开(公告)日:2024-03-29

    申请号:CN202311769679.6

    申请日:2023-12-21

    Abstract: 本发明公开了一种基于多源信息融合的轻量化车辆再辨识方法,涉及计算机视觉与机器学习技术领域,包括:构建神经网络;所述神经网络包括依次连接的ResNet50网络、局部特征融合网络和混合注意力模块;使用监督对比损失和多源信息识别损失对神经网络进行联合训练,直至收敛,得到教师网络;选取计算量和参数量比教师网络均小的模型作为学生网络;通过知识蒸馏,对学生网络进行监督,训练直至收敛,得到轻量化的车辆再辨识模型;基于轻量化的车辆再辨识模型,输出再辨识结果。本发明利用多源信息融合的方式协调不同传感器数据以提高再辨识性能,并辅以知识蒸馏,实现在有限的计算资源下,实现高质量的再辨识,从而为各种应用场景提供了更多的灵活性。

    基于灰度样本自适应选择门的野生动物类别识别方法

    公开(公告)号:CN116994295B

    公开(公告)日:2024-02-02

    申请号:CN202311256034.2

    申请日:2023-09-27

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于灰度样本自适应选择门的野生动物类别识别方法,涉及机器视觉技术领域,利用灰度图像作为辅助模态来缓解可见光图像和红外光图像之间的模态差异。具体地说,本发明以可见光图像和灰度图像之间在特征空间中的差异来模拟可见光图像和红外光图像的模态差异,设计一种基于神经网络的自适应选择门模块,从可见光图像和灰度图像的特征差异中学习出灰度图像的重要性,用于合理控制灰度图像参与模型鉴别性训练的程度,解决因白天可见光图像与夜晚红外光图像之间模态跨度变化大,导致计算机对野生动物难以准确识别的问(56)对比文件张典;汪海涛;姜瑛;陈星.基于轻量网络的近红外光和可见光融合的异质人脸识别.小型微型计算机系统.2020,(04),全文.

    一种面向无监督图像检索的模拟抗污伪标签增强方法

    公开(公告)号:CN117456312A

    公开(公告)日:2024-01-26

    申请号:CN202311779473.1

    申请日:2023-12-22

    Applicant: 华侨大学

    Abstract: 本发明提出一种面向无监督图像检索的模拟抗污伪标签增强方法,涉及计算机视觉领域,包括:利用无监督图像检索模型提取图像数据集中所有图像特征,并通过聚类算法为每张图像分配伪标签;采用伯努利随机分布对图像特征向量随机置零以模拟特征污染,获得随机污染特征向量;基于随机污染特征向量计算随机污染后验类别概率,并进行后验类别概率最大池化以获得抗污染后验类别信息;归一化抗污染后验类别信息获得抗污染后验类别概率,将抗污染后验类别概率与聚类产生的伪标签线性组合,以实现伪标签增强,从而改善无监督图像检索准确性,可广泛应用于图像搜索引擎。

    基于空间与通道注意力之注意力协同的车辆再辨识方法

    公开(公告)号:CN117333826A

    公开(公告)日:2024-01-02

    申请号:CN202310947820.0

    申请日:2023-07-31

    Applicant: 华侨大学

    Abstract: 由于具有鉴别性的局部组件信息在整车图像中占比很少,且监控场景复杂多变,缺乏明确组件位置信息,因此空间注意力机制易出现细节信息偏移、丢失等问题。为此,本发明提供一种基于空间与通道注意力之注意力协同的车辆再辨识方法,利用对特征映射空间位置不敏感的通道注意力协同空间注意力学习,获得更好的特征学习效果。首先,本发明利用空间注意力机制和通道注意力机制分别从特征映射中学习空间重要性掩码和通道重要性掩码。其次,本发明设计基于注意力子网的空间重要性掩码和通道重要性掩码协同方法,以生成空间‑通道复合重要性掩码,提升车辆再辨识准确性。本发明可广泛应用于智慧城市、智慧交通以及智慧安防中的智能视频监控系统。

    基于多尺度注意力相似化蒸馏的无人机检测方法及装置

    公开(公告)号:CN117315516A

    公开(公告)日:2023-12-29

    申请号:CN202311616489.0

    申请日:2023-11-30

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多尺度注意力相似化蒸馏的无人机检测方法及装置,涉及目标检测领域,包括:构建多尺度注意力图生成模块、教师网络及待训练的学生网络,通过多尺度注意力图生成模块分别将教师网络和学生网络的中间层特征映射转换为教师空间注意力信息和学生空间注意力信息,并建立注意力信息相似度优化损失函数,将注意力信息相似度优化损失函数与全局性的后验概率蒸馏函数以及学生网络的无人机目标分类损失函数和目标框回归损失函数结合以建立总损失函数,基于总损失函数对待训练的学生网络进行训练,得到经训练的学生网络;将图像输入经训练的学生网络,得到无人机检测结果,解决现有技术无人机检测准确率低、实时性差的问题。

    基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置

    公开(公告)号:CN117014610B

    公开(公告)日:2023-12-29

    申请号:CN202311280429.6

    申请日:2023-10-07

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置,涉及视频编码领域,该方法包括:获取屏幕内容视频,将128×128大小的CTU直接划分为64×64大小的CU;构建多任务学习网络模型,多任务学习网络模型包括主干网络、第一子网络和第二子网络,主干网络用于提取CU特征,将CU特征输入第一子网络和第二子网络,得到CU划分类型和编码模式,可结合编码模式及其预测概率和临近CU的划分类型综合确定预测结果;将64×64大小的CU输入经训练的多任务学习网络模型,得到第一预测结果;若第一预测结果为划分,则进一步划分为4个32×32大小的CU,并输入经训练的多任

    基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置

    公开(公告)号:CN117014610A

    公开(公告)日:2023-11-07

    申请号:CN202311280429.6

    申请日:2023-10-07

    Applicant: 华侨大学

    Abstract: 本发明公开了一种基于多任务学习的H.266VVC屏幕内容帧内CU快速划分方法及装置,涉及视频编码领域,该方法包括:获取屏幕内容视频,将128×128大小的CTU直接划分为64×64大小的CU;构建多任务学习网络模型,多任务学习网络模型包括主干网络、第一子网络和第二子网络,主干网络用于提取CU特征,将CU特征输入第一子网络和第二子网络,得到CU划分类型和编码模式,可结合编码模式及其预测概率和临近CU的划分类型综合确定预测结果;将64×64大小的CU输入经训练的多任务学习网络模型,得到第一预测结果;若第一预测结果为划分,则进一步划分为4个32×32大小的CU,并输入经训练的多任务学习网络模型,得到第二预测结果,解决H.266VVC屏幕内容帧内编码复杂度高的问题。

Patent Agency Ranking