一种基于强化学习的结构化道路无人驾驶决策规划方法

    公开(公告)号:CN111473794A

    公开(公告)日:2020-07-31

    申请号:CN202010249138.0

    申请日:2020-04-01

    Abstract: 本发明公开了一种基于强化学习的结构化道路无人驾驶决策规划方法,结合强化学习和传统贝塞尔曲线轨迹生成方法的优点,利用DQN网络进行决策方法的训练,并根据决策信息利用贝塞尔曲线规划最优轨迹;本发明是在已知高精度地图、全局路径的前提下对智能车辆所在的局部行驶环境进行智能决策与规划,实现结构化道路下符合人类驾驶习惯的安全决策;利用DQN网络,输入多帧车辆所处的局部地图,得到的决策信息结合轨迹规划方法得到reward反馈,驱动DQN网络的更新。

    一种双闭环直流调速系统的教学实验装置

    公开(公告)号:CN109256026B

    公开(公告)日:2020-07-14

    申请号:CN201811389491.8

    申请日:2018-11-21

    Abstract: 本发明公开一种双闭环直流调速系统的教学实验装置,该装置包括:模拟信号给定模块、转速环模拟控制器、电流环模拟控制器、晶闸管驱动电路、主电路和被控对象直流伺服电机,以及电流检测和变换电路、旋转编码器和转速变换电路;该装置还包括:模数转换模块以及依次连接的数字信号给定模块、转速环数字控制器、电流环数字控制器、数模转换模块和功率放大模块;模拟信号给定模块给定的模拟信号、转速反馈信号分别经模数转换模块输入至转速环数字控制器的输入端;电流反馈信号经模数转换模块输入至电流环数字控制器的输入端;功率放大模块输出端与晶闸管驱动电路的输入端连接。利用本发明进行实验时无需上位机即可实现参数整定,人机交互友好。

    交叉空翻式三足机器人
    13.
    发明公开

    公开(公告)号:CN103963868A

    公开(公告)日:2014-08-06

    申请号:CN201410196505.X

    申请日:2014-05-12

    Abstract: 本发明涉及一种交叉空翻式三足机器人的设计,包括顶盘和腿部系统。本设计具有三足机器人运动灵活性,稳定性特点,通过设计实现了以交叉翻转为核心的运动方案。设计采用闭环分布控制结构,共有10个主自由度,用于完整确定机器人运动姿态。腿部设计考虑了用户在应用中大范围调整和小范围微调的不同需求,利于实际中传感装置的安装。顶盘设计在简化控制难度目的下,设计了行星轮结构,将自由度控制代以电机位置伺服控制,结构紧凑。闭环结构提高了执行机构控制精度。该发明具有行进于一般平面,崎岖及光滑路面的特点,提出解决目前足式机器人设计瓶颈,成本高等方面问题,广泛应用于生产生活,在侦察感知、人员探测领域,具有广泛的应用前景。

    一种基于深度强化学习的VRPSDPTW问题求解方法

    公开(公告)号:CN119941104A

    公开(公告)日:2025-05-06

    申请号:CN202510060602.4

    申请日:2025-01-15

    Inventor: 张婷 崔同悦

    Abstract: 本发明针对车辆路径问题领域,具体涉及一种基于深度强化学习的考虑同时送取货和时间窗车辆路径问题(VRPSDPTW)求解方法。方法步骤为:1)建立目标函数,构建考虑时间窗和同时送取货的路径问题数学模型,并确定模型约束条件;2)根据所述数学模型搭建强化学习环境;3)根据所述强化学习环境搭建基于注意力机制的神经网络模型;4)使用数据集和深度强化学习算法对构建的神经网络模型进行训练,得到效果符合要求的应用模型,并用于求解物流配送场景,输出配送方案。本发明设计的深度强化学习算法在训练后能够在不同规模尤其是大规模的车辆路径问题求解实例上表现出良好的求解质量和速度。

    一种具有交通环境普适性的动态时空体素决策规划方法及装置

    公开(公告)号:CN117572860A

    公开(公告)日:2024-02-20

    申请号:CN202311401483.1

    申请日:2023-10-26

    Abstract: 一种具有交通环境普适性的动态时空体素决策规划方法及装置,该方法包括以下步骤:基于道路中各动态障碍物的轨迹预测结果,生成多个动态体素;基于所有候选车道的每个单位时间生成的动态体素,从当前位置出发,针对每个可能到达的目标位置,考虑每个时间或空间相连的体素之间的转移代价,搜索转移代价最低的体素序列;将搜索得到的体素序列作为边界约束,进一步求解优化轨迹。该方法将道路上动态障碍物的位置及速度均反映到体素中,能够帮助主车在各种场景下进行更加合理的轨迹规划,保证安全的同时获得最优路径。

    一种基于动作-状态联合学习的车辆尾灯状态识别方法

    公开(公告)号:CN113111862B

    公开(公告)日:2022-12-13

    申请号:CN202110519911.5

    申请日:2021-05-13

    Abstract: 本发明提供一种基于动作‑状态联合学习的车辆尾灯状态识别方法,首先基于真实交通场景中得到的车辆跟踪序列获取连续的跟踪片段数据,采用基于注意力模型的CNN‑LSTM网络来识别各跟踪片段数据内隐含的5类尾灯动作特征:不变、踩刹车、松刹车、左转、右转;然后,基于尾灯语义分割获取各跟踪片段对应的高位刹车灯平均亮度特征,并与尾灯动作特征形成高阶特征;最后,构造线性链条件随机场模型,通过分析高阶特征建立连续片段之间的长期依赖,推断出各时刻连续的尾灯状态:无动作、制动、左转、右转;因此,本发明能够在不同的实际复杂交通场景中,准确提取出每一帧图像中不同类型、不同标准的车辆的尾灯隐含语义特征,得到尾灯在各时刻下的连续稳定状态。

    一种基于强化学习的结构化道路无人驾驶决策规划方法

    公开(公告)号:CN111473794B

    公开(公告)日:2022-02-11

    申请号:CN202010249138.0

    申请日:2020-04-01

    Abstract: 本发明公开了一种基于强化学习的结构化道路无人驾驶决策规划方法,结合强化学习和传统贝塞尔曲线轨迹生成方法的优点,利用DQN网络进行决策方法的训练,并根据决策信息利用贝塞尔曲线规划最优轨迹;本发明是在已知高精度地图、全局路径的前提下对智能车辆所在的局部行驶环境进行智能决策与规划,实现结构化道路下符合人类驾驶习惯的安全决策;利用DQN网络,输入多帧车辆所处的局部地图,得到的决策信息结合轨迹规划方法得到reward反馈,驱动DQN网络的更新。

    一种基于动作-状态联合学习的车辆尾灯状态识别方法

    公开(公告)号:CN113111862A

    公开(公告)日:2021-07-13

    申请号:CN202110519911.5

    申请日:2021-05-13

    Abstract: 本发明提供一种基于动作‑状态联合学习的车辆尾灯状态识别方法,首先基于真实交通场景中得到的车辆跟踪序列获取连续的跟踪片段数据,采用基于注意力模型的CNN‑LSTM网络来识别各跟踪片段数据内隐含的5类尾灯动作特征:不变、踩刹车、松刹车、左转、右转;然后,基于尾灯语义分割获取各跟踪片段对应的高位刹车灯平均亮度特征,并与尾灯动作特征形成高阶特征;最后,构造线性链条件随机场模型,通过分析高阶特征建立连续片段之间的长期依赖,推断出各时刻连续的尾灯状态:无动作、制动、左转、右转;因此,本发明能够在不同的实际复杂交通场景中,准确提取出每一帧图像中不同类型、不同标准的车辆的尾灯隐含语义特征,得到尾灯在各时刻下的连续稳定状态。

    一种基于多目标跟踪预测的时空地图下自主导航方法

    公开(公告)号:CN110362083B

    公开(公告)日:2021-01-26

    申请号:CN201910647111.4

    申请日:2019-07-17

    Abstract: 本发明公开了一种基于多目标跟踪预测的时空地图下自主导航方法,该方法获得二维空间占据栅格语义地图和目标位置时间序列,将二维空间占据栅格语义地图按照时间维度进行信息堆叠,获得xy‑t地图;将目标位置时间序列投影到xy‑t地图;在xy‑t地图中进行路径规划,获得最优路径;规划过程需要遵循时间不可逆的原则,同时避开所有动态目标及静态环境的影响;将最优路径按时间步长拆分为多段并映射到xy平面内,获得多个空间域内二维轨迹序列和连续期望速度序列。根据空间域内二维轨迹序列和连续期望速度序列完成自主导航。本发明不仅有效克服动态目标对路径规划的扰动,而且相比于传统空间导航地图,该时空导航地图可以极大地简化动态规划问题。

    一种基于长短记忆网络的多重车辆轨迹预测方法

    公开(公告)号:CN110610271A

    公开(公告)日:2019-12-24

    申请号:CN201910876478.3

    申请日:2019-09-17

    Inventor: 付梦印 张婷

    Abstract: 本发明公开了一种基于长短记忆网络的多重车辆的轨迹预测方法,将主车和其邻车的历史轨迹等特征作为输入,充分考虑到车辆之间的位置以及驾驶行为的相互影响;经过网络的编码解码之后,将输出的邻近车辆的未来轨迹进一步输入混合密度网络,估计出车辆位置的概率分布,每次训练将混合密度网络的误差和轨迹结果的均方根误差以及编码器解码器网络的参数正则化项相结合,构成损失函数,指导网络参数的更新,如此可提高申请网络的预测准确性,训练好的神经网络可以预测邻车的带有概率的位置信息,将位置信息按照时间的顺序形成连续的轨迹,可以辅助主车进行决策和规划。

Patent Agency Ranking