-
公开(公告)号:CN108724182A
公开(公告)日:2018-11-02
申请号:CN201810498479.4
申请日:2018-05-23
Applicant: 苏州大学 , 网易(杭州)网络有限公司
IPC: B25J9/16
Abstract: 本发明涉及一种基于多类别模仿学习的端到端游戏机器人生成方法及系统,为获得与不同技术等级玩家的游戏水平更加匹敌的游戏机器人而设计。本发明基于多类别模仿学习的端到端游戏机器人生成方法包括:建立玩家样本数据库;策略生成器与策略判别器、策略分类器组成对抗网络,所述策略生成器在对抗网络中进行模仿学习,所述策略生成器得到与不同技术等级玩家游戏行为相仿的游戏策略,进而生成游戏机器人,其中策略生成器、策略判别器、策略分类器均为多层神经网络。本发明能够获得多类别的游戏机器人,每个分类下的机器人都能模仿出与相应分类玩家相近的游戏策略。
-
公开(公告)号:CN107544516A
公开(公告)日:2018-01-05
申请号:CN201710940590.X
申请日:2017-10-11
Applicant: 苏州大学
IPC: G05D1/02
Abstract: 本发明涉及一种基于相对熵深度逆强化学习的自动驾驶系统,包括:(1)客户端:显示驾驶策略;(2)驾驶基础数据采集子系统:采集道路信息;(3)存储模块:与客户端及驾驶基础数据采集子系统连接并存储驾驶基础数据采集子系统所采集到的道路信息;其中,驾驶基础数据采集子系统采集道路信息并将所述道路信息传输给客户端及存储模块,存储模块接收道路信息,并将持续的一段道路信息存储为历史轨迹,根据历史轨迹进行分析计算模拟出驾驶策略,存储模块将所述驾驶策略传输至客户端以供用户选择,客户端接收道路信息并根据用户选择实施自动驾驶。本发明系统采用相对熵的深度逆强化学习算法实现无模型下自动驾驶。
-
公开(公告)号:CN108724182B
公开(公告)日:2020-03-17
申请号:CN201810498479.4
申请日:2018-05-23
Applicant: 苏州大学 , 网易(杭州)网络有限公司
IPC: B25J9/16
Abstract: 本发明涉及一种基于多类别模仿学习的端到端游戏机器人生成方法及系统,为获得与不同技术等级玩家的游戏水平更加匹敌的游戏机器人而设计。本发明基于多类别模仿学习的端到端游戏机器人生成方法包括:建立玩家样本数据库;策略生成器与策略判别器、策略分类器组成对抗网络,所述策略生成器在对抗网络中进行模仿学习,所述策略生成器得到与不同技术等级玩家游戏行为相仿的游戏策略,进而生成游戏机器人,其中策略生成器、策略判别器、策略分类器均为多层神经网络。本发明能够获得多类别的游戏机器人,每个分类下的机器人都能模仿出与相应分类玩家相近的游戏策略。
-
-