-
公开(公告)号:CN119828479A
公开(公告)日:2025-04-15
申请号:CN202510010567.5
申请日:2025-01-03
Applicant: 上海交通大学
IPC: G05B13/04
Abstract: 本发明涉及路径规划技术领域,提供了一种基于深度强化学习的路径探索参数优化系统,包括:可变参数路径规划模块,用于基于深度强化学习网络进行节点探索,对子节点集合中的子节点进行碰撞检测以及计算所有的子节点的代价值,最后通过Reeds‑Shepp曲线生成装载泊入路径;环境状态空间建模模块,用于对当前节点的周围障碍物进行区域划分,以及进行环境状态空间建模;深度学习参数优化模块,用于构建深度学习网络计算出最优步长和最优转向角,并构建奖励函数对深度学习网络进行优化,同时执行深度学习网络的训练流程。实现通过深度强化学习网络优化路径规划方法中的探索参数以及通过分析环境中的障碍物信息,建立考虑障碍物分布的状态空间。
-
公开(公告)号:CN119759034A
公开(公告)日:2025-04-04
申请号:CN202510010554.8
申请日:2025-01-03
Applicant: 上海交通大学
Abstract: 本发明涉及路径规划技术领域,提供了一种规则和数据混合驱动的无人矿卡路径规划系统,包括:构建节点引导搜索规则,对于任意一个当前子节点采用固定步长和均匀离散采样后的转向角进行节点探索得到固定步长的下一个子节点的探索子节点集合,并通过深度强化学习生成引导节点加入到探索子节点集合中,对探索子节点集合中每一个探索子节点的代价进行评估,用于后续每轮迭代搜索过程中获取代价最低的探索子节点作为最终选择的下一个子节点,同时在当前子节点到终点的距离小于设定阈值时,生成当前子节点到终点的泊位曲线,从而得到最终全局曲线。上述技术方案,构建了规则‑数据混合驱动路径规划框架,实现了规则和学习方法的优势互补。
-