-
公开(公告)号:CN109726676B
公开(公告)日:2020-07-07
申请号:CN201811622988.X
申请日:2018-12-28
Applicant: 苏州大学
Abstract: 本发明公开了一种自动驾驶系统的规划方法。本发明一种自动驾驶系统的规划方法,包括:S1、当所述系统获取了当前道路环境图像g后,利用卷积神经网络中的过滤器提取道路图像的结构及路况信息φ,φ经由映射函数fR得到当前道路环境图像的奖赏信息R、经由映射函数fP得到用于非规则图形卷积操作的核函数Kwp的初始化,并利用图像的邻接矩阵作为Kwp的激活参数得到初始的卷积操作子P。本发明的有益效果:本发明公开的基于广义异步值迭代网络模型的深度强化学习方法,能够很好地应对现有的自动驾驶系统在结构复杂、路况信息未知的道路环境中无法进行高成功率和高准确率的道路规划的问题。
-
公开(公告)号:CN108970119A
公开(公告)日:2018-12-11
申请号:CN201810778924.2
申请日:2018-07-16
Applicant: 苏州大学 , 网易(杭州)网络有限公司
Abstract: 本发明公开了一种基于基于优先级值迭代网络的难度自适应游戏系统策略规划方法。该游戏系统由两部分构成:用于进行图像特征信息提取的卷积神经网络和用于进行策略泛化处理的优先级值迭代网络。该系统可嵌入至任意对抗类游戏中,当玩家开始游戏前,会从系统的难度系数中选择某一等级的对抗机器人(Adversarial Non-personal Character,A-NPC)。根据选定的难度系数,系统会从服务器的数据库中获取相应难度的玩家样本策略信息,并在服务器端根据玩家样本策略信息进行模仿学习,得到优先级值迭代网络的参数。该参数在游戏载入时传送至客户端。
-
公开(公告)号:CN109726676A
公开(公告)日:2019-05-07
申请号:CN201811622988.X
申请日:2018-12-28
Applicant: 苏州大学
Abstract: 本发明公开了一种自动驾驶系统的规划方法。本发明一种自动驾驶系统的规划方法,包括:S1、当所述系统获取了当前道路环境图像g后,利用卷积神经网络中的过滤器提取道路图像的结构及路况信息φ,φ经由映射函数fR得到当前道路环境图像的奖赏信息R、经由映射函数fP得到用于非规则图形卷积操作的核函数Kwp的初始化,并利用图像的邻接矩阵作为Kwp的激活参数得到初始的卷积操作子P。本发明的有益效果:本发明公开的基于广义异步值迭代网络模型的深度强化学习方法,能够很好地应对现有的自动驾驶系统在结构复杂、路况信息未知的道路环境中无法进行高成功率和高准确率的道路规划的问题。
-
-