-
公开(公告)号:CN119152250A
公开(公告)日:2024-12-17
申请号:CN202411058129.8
申请日:2024-08-02
Applicant: 北京理工大学
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0495 , G06N3/08 , G06N5/04
Abstract: 本发明涉及一种基于全量化VGG风格卷积神经网络的图像分类方法,属于人工智能与图像处理技术领域。首先预训练全精度图像分类网络,为低比特量化提供具有高精度、量化友好的良好初始化权值。然后进行低比特量化感知训练,获取性能优异的低比特量化VGG风格卷积神经网络权值。将量化后网络中的低精度‑高精度数转换映射、批正则化层和激活层进行融合合并为查找表参数,并将剩余的卷积层网络参数从浮点数表示低伪低精度整数转换为真正的低精度整数网络参数,用于部署。利用转换后的图像分类网络,进行图像分类。本发明极大改善了低比特量化的VGG风格卷积神经网络的性能,提升了图像分类的精确度和推理速度,具有较高的实际应用价值。
-
公开(公告)号:CN119152178A
公开(公告)日:2024-12-17
申请号:CN202411058242.6
申请日:2024-08-02
Applicant: 北京理工大学
IPC: G06V10/25 , G06V10/774 , G06V10/82 , G06N20/00 , G06N3/08 , G06N3/0442 , G06N3/0464
Abstract: 本发明涉及一种基于数据和特征的红外小目标检测优化方法及系统,属于计算机视觉技术领域。首先预处理红外小目标数据集中的训练数据,并对训练数据进行分类,随机裁剪扩充数据量。将分类好的数据和其对应的标签输入扩散模型进行训练。然后,加载训练好的扩散模型参数,输入随机噪声、随机类别和随机标签生成红外数据,融入原始训练数据,得到新的合成训练数据集。在神经网络中,应用基于记忆的检测头,使用合成数据集进行训练。最后加载训练好的网络参数,输入需要检测的红外图像,得到检测结果。本发明引入了扩散模型来生成红外数据,增加了训练数据的多样性,提高了检测精度和稳定性。
-
公开(公告)号:CN119152177A
公开(公告)日:2024-12-17
申请号:CN202411057948.0
申请日:2024-08-02
Applicant: 北京理工大学
IPC: G06V10/25 , G06V20/70 , G06V10/40 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0442
Abstract: 本发明涉及一种基于上下文语义信息聚合的小目标图像检测方法,属于计算摄像技术领域。本方法采用两阶段检测模型,引入基于上下文信息聚合的特征增强模块和多级检测头辅助模型,以实现对小目标的准确检测。本方法能够在复杂的自然图像特征中快速学习到同类小目标特征之间的内在关联,在目标检测的推理过程中将已经学习到的同类小目标特征之间的内在关联和上下文信息与网络提取到的小目标特征信息聚合,有效增强小目标的特征表示。本方法不需要依赖特定的数据集训练就能达到良好的检测识别效果。
-
公开(公告)号:CN117333378A
公开(公告)日:2024-01-02
申请号:CN202310959003.7
申请日:2023-08-01
Applicant: 北京理工大学
Abstract: 本发明涉及一种自监督视频去噪方法及系统,属于计算机视觉技术领域。本发明包含两个平行分支,分别侧重于远距离和近邻的时间信息的融合。对于长距离分支,本发明提出了一个时间特征融合模块,以空间自适应的方式将参考盲点特征与时间上传播的非盲点特征相结合。对于局部分支,本发明提出了局部特征提取模块,利用三维盲点卷积来利用空间和时间上的局部信息,同时缓解了普通递归框架中的错误积累。本发明在对自监督的盲点要求的精细考虑下实现了一个更密集的感受野,能够充分利用参考帧和邻近帧中存在的信息,为改善细节重建提供有价值的信息。在盲点约束下,本发明采用循环递归方式,增加了可用的时间信息,利用更多的帧间相似性来增强修复过程。
-
-
-