-
公开(公告)号:CN119832211A
公开(公告)日:2025-04-15
申请号:CN202411812939.8
申请日:2024-12-11
Applicant: 无锡学院
Abstract: 本发明公开了一种航拍场景红外小目标检测方法、电子设备及存储介质,属于计算机视觉和图像处理领域技术领域。本发明方法训练一个动态多尺度共享目标检测网络实现红外目标检测,检测网络由骨干网络、颈部网络、头部网络组成,其中骨干网络包含动态共享特征分解层以及扩张多尺度金字塔层,颈部网络由多个上采样层、拼接层、动态共享特征分解层、卷积层级联而成,头部网络包含回归定位分支与分类预测分支。本发明目标检测方法采用动态共享机制与多尺度特征处理相结合,实现对图像特征的高效提取与融合,方法融合多尺度特征和上下文信息,既保留了高层语义信息,又保留了低层细节特征,使得检测目标的边界定位更加精准,分类更加可靠。
-
公开(公告)号:CN119190018B
公开(公告)日:2025-04-01
申请号:CN202411399795.8
申请日:2024-10-09
Applicant: 无锡学院
Abstract: 本发明公开了一种基于V2X的路口盲区辅助驾驶方法及系统,涉及智能辅助驾驶技术领域,包括,通过车载传感器采集多模态数据并进行预处理,对预处理后的多模态数据进行特征提取,构成模态特征向量;基于多模态特征向量,采用深度学习模型进行综合感知,识别路口盲区内的障碍物位置;实时监测路口盲区内的障碍物位置变化,预测障碍物的未来运动轨迹;根据障碍物的未来运动轨迹,评估车辆通过路口的风险等级;通过V2X通信接收实时交通信息,结合实时交通信息与风险等级,生成驾驶决策。本发明通过实时监测障碍物位置变化、预测运动轨迹和评估风险与V2X通信的结合,最终生成了更加安全、高效的驾驶决策。
-
公开(公告)号:CN119697442A
公开(公告)日:2025-03-25
申请号:CN202411816812.3
申请日:2024-12-11
Applicant: 无锡学院
IPC: H04N21/472 , H04N21/458 , H04N21/44 , H04N21/435 , H04N21/442
Abstract: 本发明公开了一种基于情感反馈的文本驱动广告视频生成方法,涉及数字广告和人机交互技术领域,通过实时采集用户面部表情、语音特征和眼动轨迹等情感数据,动态调整广告内容,提升个性化、互动性和转化率;结合文本生成视频模型与多模态情感识别技术,利用特征融合和反馈处理,使广告视频更契合用户情感;多轮反馈与自适应优化确保广告传递核心信息的同时灵活响应用户情感状态,大幅提升吸引力与参与度,创新的特征融合算法进一步提高了生成视频的个性化和实时响应能力,为数字广告领域提供了全新解决方案,推动了个性化与情感互动的发展。
-
公开(公告)号:CN119131738B
公开(公告)日:2025-03-14
申请号:CN202411623141.9
申请日:2024-11-14
Applicant: 无锡学院
Abstract: 本发明提出了一种智能网联汽车视觉环境感知方法及系统,通过汽车视觉传感器获取周围图像数据,经过预处理、图像分割、特征识别和神经网络分析,最终输出详细的环境信息。具体步骤包括:首先对图像数据进行滤波处理,得到清晰的第一图像;然后通过种子像素扩张法对第一图像进行分割,形成第二图像集合;接着对每个图像进行特征识别,标记特征属性;最后将图像传输至神经网络中进行分析,整合结果后输出环境信息。该方法采用卷积神经网络和循环神经网络,分别处理单帧图像和多帧图像,提高了环境感知的准确性和实时性。
-
公开(公告)号:CN119516513A
公开(公告)日:2025-02-25
申请号:CN202411626109.6
申请日:2024-11-14
Applicant: 无锡学院
IPC: G06V20/58 , G06T5/50 , G06V10/80 , G06V10/82 , G06V10/764 , G06V10/774 , G06T5/73 , G06F17/18 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种道路目标检测方法、电子设备及存储介质,属于目标检测的技术领域;其中的道路目标检测方法包括:获取多模态图像数据集并进行预处理,构建双流特征提取主干网络,分别对可见光图像和红外图像进行特征提取;设计自适应特征对齐融合模块,通过特征级联和交叉注意力机制实现不同模态特征的动态融合,自适应调整不同模态的权重;设计三分支动态参数增强模块,集成去雾和低光照增强功能,通过轻量级参数估计网络对场景质量进行优化;采用两阶段训练策略,第一阶段通过预训练建立基本特征提取能力,第二阶段聚焦优化场景退化问题。本发明能够提高特征互补性,能够有效解决恶劣天气条件下的道路目标检测问题。
-
公开(公告)号:CN119314144A
公开(公告)日:2025-01-14
申请号:CN202411359381.2
申请日:2024-09-27
Applicant: 无锡学院
IPC: G06V20/58 , G06V10/25 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种基于改进RT‑DETR的自动驾驶目标检测方法,涉及目标检测和自动驾驶领域技术领域,获取公开的自动驾驶目标检测数据集SODA10M;构建FSSD‑DETR算法的主干网络,使用FDC模块替换P5层中的BasicBlock优化特征提取过程;在RT‑DETR算法的颈部网络中引入小目标检测层提升对于远处小目标的检测性能;构建FSSD‑DETR算法的颈部网络,使用Zoom_cat模块和ScalSeq模块优化特征融合过程;构建FSSD‑DETR算法的上采样算子,使用DySample上采样算子替换最近邻插值法以提升图像质量;从而在处理小目标、密集车辆和遮挡等复杂交通场景时保持良好的性能。
-
公开(公告)号:CN119313717A
公开(公告)日:2025-01-14
申请号:CN202411858244.3
申请日:2024-12-17
Applicant: 无锡学院
IPC: G06T7/50 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开一种车载摄像头能见度反演方法、装置、介质及电子设备,其中,车载摄像头能见度反演方法,包括:获取车载摄像头拍摄的图像帧数据集,并进行预处理,构建能见度反演数据集;构建能见度反演模型,该能见度反演模型以能见度真值为输出,经训练优化网络权重获得;将车载摄像头实时拍摄的照片,输入到优化后的能见度反演模型,获得当前能见度真值。本发明可以较为准确地估算出相应的能见度,实现高精度的能见度实时反演。
-
公开(公告)号:CN118762339B
公开(公告)日:2025-01-03
申请号:CN202411215008.X
申请日:2024-09-02
Applicant: 无锡学院
IPC: G06V20/54 , G06N3/0464 , G06V10/77 , G06V10/80 , G06V10/82
Abstract: WPIoU损失函数构建方法及YOLOv8检测方法,属于图像信息检测技术领域,解决了现有的YOLOv8n在复杂环境下无法实现对车流图像的精准检测的问题。包括以下步骤:步骤S1,对WIoUv1损失函数做梯度增益的处理后,获取WIoUv3损失函数;步骤S2,PIoU损失函数自定义了自适应的惩罚因子;步骤S3,基于步骤S2所述的惩罚因子对步骤S1所述的WIoUv3损失函数进行改进后,获取WPIoU损失函数;步骤S4,基于PIOUv2损失函数的非单调注意力函数对步骤S3所述的WPIoU损失函数做进一步改进后,获取最终的WPIoU损失函数。
-
公开(公告)号:CN119229476A
公开(公告)日:2024-12-31
申请号:CN202411718475.4
申请日:2024-11-28
Applicant: 无锡学院
IPC: G06V40/10 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/20 , G06V10/40 , G06V10/80 , G06V10/82
Abstract: 基于深度学习特征增强的复杂背景下昆虫检测方法和系统,涉及小目标检测领域。解决了农业昆虫检测缺乏真实场景中动态捕获到的昆虫图像的问题。方法包括:获取图像,并对所述图像进行预处理;构建S‑Insect‑Det网络结构,S‑Insect‑Det网络结构包括主干网络、颈部网络和检测头;所述主干网络为基于Transformer的EfficientViT网络;所述颈部网络为双向多尺度融合架构;通过主干网络进行图像特征提取,并通过颈部网络进行多尺度特征融合;通过检测头输出特征融合后的特征表示,获取昆虫识别结果。本发明应用于昆虫识别领域。
-
公开(公告)号:CN119152344A
公开(公告)日:2024-12-17
申请号:CN202411527852.6
申请日:2024-10-30
Applicant: 无锡学院
Abstract: 本发明公开了一种基于改进YOLOv8的异常行为检测方法、设备及存储介质;该方法提出了一种新的FDPN结构,替代原YOLOv8模型的颈部网络架构;FDPN的优势在于特征聚焦模块和特征扩散机制,特征聚焦模块通过并行的深度卷积操作有效捕捉并整合跨尺度特征信息,扩散机制则促进上下文信息在各尺度间流动,使每个特征图都包含详尽的语义信息,从而提升小目标检测精度,并增强网络对遮挡和复杂背景的适应能力。此外,本发明还引入RCSOSA模块和DyHead动态预测头;RCSOSA模块通过RepVGG模块提取和增强多样化特征,并通过多个RCS模块优化特征选择和通道混洗,增强通道间的特征融合;使用DyHead动态预测头能提高对被遮挡人群的识别能力。本发明显著提高了复杂场景下的异常行为检测的鲁棒性和精度。
-
-
-
-
-
-
-
-
-