一种基于深度强化学习的路径探索参数优化系统及方法

    公开(公告)号:CN119828479A

    公开(公告)日:2025-04-15

    申请号:CN202510010567.5

    申请日:2025-01-03

    Abstract: 本发明涉及路径规划技术领域,提供了一种基于深度强化学习的路径探索参数优化系统,包括:可变参数路径规划模块,用于基于深度强化学习网络进行节点探索,对子节点集合中的子节点进行碰撞检测以及计算所有的子节点的代价值,最后通过Reeds‑Shepp曲线生成装载泊入路径;环境状态空间建模模块,用于对当前节点的周围障碍物进行区域划分,以及进行环境状态空间建模;深度学习参数优化模块,用于构建深度学习网络计算出最优步长和最优转向角,并构建奖励函数对深度学习网络进行优化,同时执行深度学习网络的训练流程。实现通过深度强化学习网络优化路径规划方法中的探索参数以及通过分析环境中的障碍物信息,建立考虑障碍物分布的状态空间。

    基于标清电子地图静态地物关联的自动驾驶全局位置估计方法及系统

    公开(公告)号:CN119437257A

    公开(公告)日:2025-02-14

    申请号:CN202510039131.9

    申请日:2025-01-10

    Abstract: 本发明公开了一种基于标清电子地图静态地物关联的自动驾驶全局位置估计方法及系统,获取自动驾驶城市运行场景下的标清电子地图;进行解析及预处理以提取自动驾驶时的车辆位置候选节点集合;对车辆位置候选节点集合进行在预设范围内的静态地物边界进行判断并进行筛选,筛选后对标清电子地图上的城市结构化静态地物描述信息进行提取来构建先验静态地物环境描述数据库;通过车辆实时感知实时输入三维点云数据,对城市结构化静态地物描述进行提取,得到实时静态地物环境描述数据;将标清电子地图内静态地物数据与车端实时感知的实时静态地物环境描述数据进行相似度关联,得到与车端实时感知相似度最高的结果以实现自动驾驶车辆的全局位置估计。

    重载车辆悬架时变特性辨识方法及系统

    公开(公告)号:CN118332689A

    公开(公告)日:2024-07-12

    申请号:CN202410441711.6

    申请日:2024-04-12

    Abstract: 一种重载车辆悬架时变特性辨识方法及系统,由传感器收集矿用卡车操纵的序列状态,通过深度学习网络根据序列状态预测得到参数相关因子;同时通过考虑纵向‑垂直耦合效应的线性动力学模型粗略估计得到刚度和阻尼系数作为关键悬架参数,再由考虑纵向‑垂直耦合效应的非线性动力学模型根据参数相关因子和关键悬架参数预测得到下一时间步的状态。本发明将深度学习网络集成到矿用卡车的物理模型中,建立精确的矿用卡车纵向‑垂直动力学模型并识别精确的悬架参数,通过物理模型‑数据驱动的方法给出矿卡悬架刚度阻尼时变特性,且模型自身具备一定的可解释性和泛化性;只通过簧上信息即获取四个悬架刚度和阻尼,具有架构简单、便于实现等优点。

    基于数据驱动的自动驾驶决策优化系统及方法

    公开(公告)号:CN119882431A

    公开(公告)日:2025-04-25

    申请号:CN202510008226.4

    申请日:2025-01-03

    Abstract: 一种基于数据驱动的自动驾驶决策优化系统及方法,该系统包括:数据生产模块、数据筛选模块、模型封装模块和参数调优模块,其中:数据生产模块以人驾数据为输入,经标注、预处理和格式转换后,提取关键特征并进行标准化、归一化和编码,生成符合算法输入要求的数据驱动过程中的原始数据;数据筛选模块根据决策器所划分的各个场景从训练数据中筛选出相应的数据并进行有效分类;模型封装模块对C++的决策代码进行封装并采用基于轨迹对的真值评估方法构建训练所需的轨迹对评估代价图;参数调优模块根据经过筛选后的不同场景下的数据、封装好的决策算法模型以及轨迹对评估代价图,利用黑盒优化的方法,得到相应场景下在当前决策算法下的决策参数。本发明结合基于规则和基于学习的方法,利用自动驾驶车辆在运行过程中产生的大量数据,从而提高决策系统的上限,更有利于决策器在实际场景中的表现且属于白盒性质的数据驱动的决策参数调节技术。

    一种规则和数据混合驱动的无人矿卡路径规划系统及方法

    公开(公告)号:CN119759034A

    公开(公告)日:2025-04-04

    申请号:CN202510010554.8

    申请日:2025-01-03

    Abstract: 本发明涉及路径规划技术领域,提供了一种规则和数据混合驱动的无人矿卡路径规划系统,包括:构建节点引导搜索规则,对于任意一个当前子节点采用固定步长和均匀离散采样后的转向角进行节点探索得到固定步长的下一个子节点的探索子节点集合,并通过深度强化学习生成引导节点加入到探索子节点集合中,对探索子节点集合中每一个探索子节点的代价进行评估,用于后续每轮迭代搜索过程中获取代价最低的探索子节点作为最终选择的下一个子节点,同时在当前子节点到终点的距离小于设定阈值时,生成当前子节点到终点的泊位曲线,从而得到最终全局曲线。上述技术方案,构建了规则‑数据混合驱动路径规划框架,实现了规则和学习方法的优势互补。

    一种基于对抗奖励训练的自动驾驶危险场景生成方法及系统

    公开(公告)号:CN119227521A

    公开(公告)日:2024-12-31

    申请号:CN202411261156.5

    申请日:2024-09-10

    Abstract: 本发明涉及自动驾驶测试领域领域,提供了一种基于对抗奖励训练的自动驾驶危险场景生成方法及系统,初始化多车道道路的驾驶仿真环境;基于车辆数据中的场景状态参数,随机生成惩罚动作,将场景状态参数、惩罚动作及对应的动作参数组成状态动作对,在无历史动作相似性惩罚的条件下,计算状态动作价值;通过惩罚函数对惩罚动作进行历史动作相似性惩罚,计算历史动作相似性惩罚更新后的状态动作价值;根据强化学习模型中的状态动作价值与期望状态动作价值的差值更新强化学习模型指导生成自动驾驶危险场景。本发明显著提高了自动驾驶系统测试的效率和质量,同时减少场景质量损失,并在较短的训练周期内,提升了场景的多样性和实用性。

    一种基于时空连续性的矿山可通行区域识别方法和系统

    公开(公告)号:CN118609077A

    公开(公告)日:2024-09-06

    申请号:CN202410761520.8

    申请日:2024-06-13

    Abstract: 本发明涉及自动驾驶感知技术领域,公开了一种基于时空连续性的矿山可通行区域识别方法和系统,包括:输入三维激光雷达点云,采用同心圆模型并通过对整体点云按照极性进行区域划分,通过自适应平面拟合判定每个划分好的所述区域是否为可通行区域,并对可通行点和非可通行点进行归类,输出为初始可通行点云集合和初始不可通行点云集合;通过连通性地面的区域滤波和点滤波两部分滤除所述初始可通行点云集合中不符合连通性要求的点云,输出为优化后的可通行点云集合和不可通行点云集合;输入当前帧点云相对于第一帧点云的位姿变换,通过时序地面滤除所述初始可通行点云集合中不稳定的点云,输出为二次优化后的可通行点云集合和不可通行点云集合。

    基于OSM类地图的SLAM地图全局对齐系统

    公开(公告)号:CN119618185A

    公开(公告)日:2025-03-14

    申请号:CN202311176923.8

    申请日:2023-09-13

    Abstract: 一种基于OSM类地图的SLAM地图全局对齐系统,包括:先验OSM类地图处理模块、SLAM地图数据处理模块、全局地图粗对齐模块以及基于图优化的细对齐模块,本发明利用先验地图中共有的拓扑结构为关键点,构建拓扑地图作为地图对齐的中转结构,达到将感知地图与路网地图对齐,赋予SLAM地图全局坐标的效果,能够实现相对较高的精度完成SLAM地图的全局坐标标定,即地理意义上的经纬度坐标,并且SLAM地图与OSM对齐之后的语义信息关联,对于未来地图的应用有较好的应用延展性。

Patent Agency Ranking