-
公开(公告)号:CN118736521B
公开(公告)日:2025-02-25
申请号:CN202410858652.2
申请日:2024-06-28
Applicant: 北京化工大学
IPC: G06V20/56 , G06V20/70 , G06V10/26 , G06V20/64 , G06V10/80 , G06V10/40 , G06V10/77 , G06V10/82 , G06T3/08 , G06N3/04
Abstract: 本申请提供一种面向复杂环境的三维语义占用感知方法及装置,其中的方法包括:获取当前时刻车辆的全景环视图像,对全景环视图像进行处理,得到三维占用感知结果;对三维占用感知结果进行下采样,得到占用查询结果;利用SAM模型对全景环视图像进行语义分割处理,得到二维语义特征图;利用空间交叉注意力机制对二维语义特征图和占用查询结果进行处理,得到融合的三维体素特征;利用三维解码器和占用头对融合的三维体素特征进行处理,得到全景环视图像的三维语义占用感知结果。本申请的方法能够实现精细化的3D语义占用预测,从而实现对复杂环境中的不规则物体更强的表示学习能力和泛化能力。
-
公开(公告)号:CN118736521A
公开(公告)日:2024-10-01
申请号:CN202410858652.2
申请日:2024-06-28
Applicant: 北京化工大学
IPC: G06V20/56 , G06V20/70 , G06V10/26 , G06V20/64 , G06V10/80 , G06V10/40 , G06V10/77 , G06V10/82 , G06T3/08 , G06N3/04
Abstract: 本申请提供一种面向复杂环境的三维语义占用感知方法及装置,其中的方法包括:获取当前时刻车辆的全景环视图像,对全景环视图像进行处理,得到三维占用感知结果;对三维占用感知结果进行下采样,得到占用查询结果;利用SAM模型对全景环视图像进行语义分割处理,得到二维语义特征图;利用空间交叉注意力机制对二维语义特征图和占用查询结果进行处理,得到融合的三维体素特征;利用三维解码器和占用头对融合的三维体素特征进行处理,得到全景环视图像的三维语义占用感知结果。本申请的方法能够实现精细化的3D语义占用预测,从而实现对复杂环境中的不规则物体更强的表示学习能力和泛化能力。
-
公开(公告)号:CN118025228B
公开(公告)日:2024-09-17
申请号:CN202410215363.0
申请日:2024-02-27
Applicant: 北京化工大学
Abstract: 本申请提供面向协同端到端大模型的自动驾驶轨迹决策方法及装置,其中的方法包括:利用第一特征提取网络对自车端的RGB图像、他车端的RGB图像和路端的RGB图像进行处理,得到第一图像特征、第二图像特征和第三图像特征;对第一图像特征、第二图像特征和第三图像特征进行融合处理得到图像融合特征;利用第二特征提取网络对路端的点云数据进行处理得到路端点云特征;对图像融合特征和路端点云特征进行处理得到第一BEV特征和第二BEV特征;对第一BEV特征和第二BEV特征进行融合得到融合BEV特征;用大视觉语言模型将prompt信息和融合BEV特征进行融合得到文本信息;利用自然语言大模型对文本信息进行处理得到自车轨迹决策结果。本申请提高了轨迹决策的准确性。
-
公开(公告)号:CN118115969B
公开(公告)日:2024-09-13
申请号:CN202410243702.6
申请日:2024-03-04
Applicant: 北京化工大学
IPC: G06V20/58 , G06V10/143 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本申请提供基于大语言模型的自动驾驶多模态感知决策方法及装置,感知决策方法包括:获取当前时刻的目标区域的RGB图像和红外图像;利用目标检测模型对RGB图像进行处理,得到目标框以及对应的目标检测类别;利用分割模型对红外图像和目标框以及对应的目标检测类别进行处理得到目标掩码图像;利用融合模型对RGB图像、目标掩码图像和红外图像进行融合得到融合特征图;利用大视觉语言模型对表征用户意图的第一prompt信息、表征目标检测类别优先级的第二prompt信息以及融合特征图进行融合处理得到文本信息;利用自然语言大模型对文本信息进行处理得到感知决策结果。本申请提高了交通参与者在自动驾驶车辆感知决策的优先级,提升了自动驾驶车辆的安全性。
-
公开(公告)号:CN115496923B
公开(公告)日:2023-10-20
申请号:CN202211131095.1
申请日:2022-09-14
Applicant: 北京化工大学
Abstract: 本申请提供了一种基于不确定性感知的多模态融合目标检测方法及装置,涉及自动驾驶技术领域,所述方法包括:获取RGB图像和点云数据;对点云数据进行处理,得到和RGB图像匹配的点云图像;对RGB图像进行特征提取得到RGB特征图,利用预先训练完成的图像目标检测模型对RGB特征图进行处理,得到第一目标检测结果;对点云图像进行特征提取,得到点云特征图,利用预先训练完成的点云目标检测模型对点云特征图进行处理,得到第二目标检测结果;通过不确定性感知的多源NMS算法,对第一目标检测结果和第二目标检测结果进行融合处理,得到融合后的目标检测结果。本申请通过不确定性实现多模态数据的自适应融合,提高自动驾驶的安全性。
-
公开(公告)号:CN115496923A
公开(公告)日:2022-12-20
申请号:CN202211131095.1
申请日:2022-09-14
Applicant: 北京化工大学
Abstract: 本申请提供了一种基于不确定性感知的多模态融合目标检测方法及装置,涉及自动驾驶技术领域,所述方法包括:获取RGB图像和点云数据;对点云数据进行处理,得到和RGB图像匹配的点云图像;对RGB图像进行特征提取得到RGB特征图,利用预先训练完成的图像目标检测模型对RGB特征图进行处理,得到第一目标检测结果;对点云图像进行特征提取,得到点云特征图,利用预先训练完成的点云目标检测模型对点云特征图进行处理,得到第二目标检测结果;通过不确定性感知的多源NMS算法,对第一目标检测结果和第二目标检测结果进行融合处理,得到融合后的目标检测结果。本申请通过不确定性实现多模态数据的自适应融合,提高自动驾驶的安全性。
-
公开(公告)号:CN118424256A
公开(公告)日:2024-08-02
申请号:CN202410470082.X
申请日:2024-04-18
Applicant: 北京化工大学
Abstract: 本申请提供一种分布式多分辨率地图融合的建图定位方法及装置,建图定位方法包括:获取空中视角的目标区域的第一全局点云地图,所述目标区域的第一全局点云地图由无人机上的激光雷达采集的多个第一局部点云地图生成;获取当前时刻无人车的激光雷达采集的第二局部点云地图;所述第二局部点云地图对应的区域为目标区域的一部分;对目标区域的第一全局点云地图和第二局部点云地图进行融合,生成融合的全局点云地图。本申请对基于空中信息的大范围低分地图和基于无人车多模态信息的地面域高分地图进行融合,得到多分辨率地图,提高了空地协同的无人车自动驾驶的定位精度。
-
公开(公告)号:CN118115969A
公开(公告)日:2024-05-31
申请号:CN202410243702.6
申请日:2024-03-04
Applicant: 北京化工大学
IPC: G06V20/58 , G06V10/143 , G06V10/25 , G06V10/80 , G06V10/82 , G06N3/0464
Abstract: 本申请提供基于大语言模型的自动驾驶多模态感知决策方法及装置,感知决策方法包括:获取当前时刻的目标区域的RGB图像和红外图像;利用目标检测模型对RGB图像进行处理,得到目标框以及对应的目标检测类别;利用分割模型对红外图像和目标框以及对应的目标检测类别进行处理得到目标掩码图像;利用融合模型对RGB图像、目标掩码图像和红外图像进行融合得到融合特征图;利用大视觉语言模型对表征用户意图的第一prompt信息、表征目标检测类别优先级的第二prompt信息以及融合特征图进行融合处理得到文本信息;利用自然语言大模型对文本信息进行处理得到感知决策结果。本申请提高了交通参与者在自动驾驶车辆感知决策的优先级,提升了自动驾驶车辆的安全性。
-
公开(公告)号:CN118015411A
公开(公告)日:2024-05-10
申请号:CN202410215362.6
申请日:2024-02-27
Applicant: 北京化工大学
IPC: G06V10/778 , G06V10/774 , G06V10/82 , G06N3/0455 , G06N3/082
Abstract: 本申请提供一种面向自动驾驶的大视觉语言模型增量学习方法及装置,增量学习方法包括:对第一训练样本集进行扩充,得到第二训练样本集;所述第二训练样本集包括多个标注道路场景目标的图像样本;将多个微调子网络分别插入第一大视觉语言模型的指定位置,生成第二大视觉语言模型;利用所述第二大视觉语言模型对第二训练样本集的图像样本进行处理,得到目标预测结果;利用所述目标预测结果和目标标注结果,计算损失值;保持所述第一大视觉语言模型的参数不变,利用所述损失值更新所述微调子网络的参数。本申请的方法在保证原模型参数不变的前提下,节省训练和储存参数成本,用少量样本实现了大模型的高效的微调。
-
公开(公告)号:CN115775377B
公开(公告)日:2023-10-20
申请号:CN202211492628.9
申请日:2022-11-25
Applicant: 北京化工大学
Abstract: 本申请提供了图像和方向盘转向角度融合的自动驾驶车道线分割方法,涉及自动驾驶技术领域,所述方法包括:获取车辆转弯时的RGB图像和转向角;利用预先训练完成的车道线检测模型对RGB图像和转向角进行处理,得到车道线分割结果;所述车道线检测模型包括:特征提取模块、融合模块和检测模块;所述特征提取模块,用于提取RGB图像的特征图;所述融合模块,用于对转向角和RGB图像的特征图进行融合,得到融合后的特征图;所述检测模块,用于对融合后的特征图进行检测,得到车道线分割结果。本申请提高了车辆转弯时的车道线检测的精度。
-
-
-
-
-
-
-
-
-