一种基于强化学习的车辆智能行驶方法

    公开(公告)号:CN117270394A

    公开(公告)日:2023-12-22

    申请号:CN202311300029.7

    申请日:2023-10-09

    Applicant: 吉林大学

    Abstract: 本发明公开了一种基于强化学习的车辆智能行驶方法,首先建立状态空间与动作空间,构建初始场景和交互训练模型,然后建立双延迟深度确定性策略梯度算法和对应的超参数;基于智能驾驶员模型对双延迟深度确定性策略梯度算法进行改进;最后将获取的初始状态信息输入改进后算法的神经网络中进行深度强化学习训练,确定出最优车辆行驶策略。本发明通过专家经验类模型对双延迟深度确定性策略梯度算法进行强化;使得强化学习算法能够快速训练至一个较好的基础策略,避免传统强化学习前期多次无用的随机探索。然后再在此基础上再次进行网络学习更新,提高车辆行驶策略质量,同时本发明通过强化学习提高了模型的泛化能力与应对能力。

    基于视觉测距的交通信号灯识别网络训练方法及测试方法

    公开(公告)号:CN115546763A

    公开(公告)日:2022-12-30

    申请号:CN202211263112.7

    申请日:2022-10-14

    Applicant: 吉林大学

    Abstract: 本发明提供了一种基于视觉测距的交通信号灯识别网络训练方法,包括以下步骤:步骤1、对采集的图像进行标注,制作交通信号灯数据集;步骤2、利用步骤1建立的数据集对信号灯识别网络模型进行训练;步骤3、利用损失函数采用梯度下降法对模型参数进行优化,用trainval子数据集对训练好的网络模型进行网络模型超参数调整,用test子数据集对最终的网络模型进行评价;当训练过程中loss趋于平缓且连续3个训练周期网络性能无提升时,选取最后的训练模型为最优模型,完成训练。本发明还提供了一种基于视觉测距的交通信号灯识别网络测试方法。本发明解决了现有技术中存在的信号灯识别准确率低,计算量大,实时性差等问题。

Patent Agency Ranking