-
公开(公告)号:CN108563112A
公开(公告)日:2018-09-21
申请号:CN201810287224.3
申请日:2018-03-30
Applicant: 南京邮电大学
Abstract: 本发明公开了一种用于仿真足球机器人控球的控制方法,利用tile coding线性函数近似方法降低状态空间维度,足球机器人智能体模块在强化学习中选择Sarsa 算法,对策略进行在线打分,高分优先选择的原则训练选择一个最优策略,仿真结果表明Sarsa 算法可大大提高控球率。本发明基于Sarsa 算法来应用强化学习,在keepaway上实验,在一个小的任务中保持球员可长时间控球,达到高持球率,从而可加大多智能体之间传球协作或可找到合适的机会射门,加大得分胜率。