-
公开(公告)号:CN119472681A
公开(公告)日:2025-02-18
申请号:CN202411625348.X
申请日:2024-11-14
Applicant: 安徽大学
IPC: G05D1/43 , G05D1/644 , G05D1/648 , G05D109/10
Abstract: 本发明公开了一种多目标进化算法辅助的多智能体强化学习的机器人行走控制方法,包括:1.建立多智能体强化学习框架中的行动者网络actor和批评家网络critic;2.将机器人的所有行走策略建立成种群,使用集中式策略扩展价值函数近似器来拟合种群个体的值,并计算其损失函数;4.使用策略新颖度和强化学习奖励值作为种群个体的双目标函数并计算相应值;5.使用多目标进化算法进行非支配排序,得到帕累托解集,筛选精英个体并进行交叉产生子代以得到最佳策略。本发明能解决机器人行走不平稳的问题,在一定的训练时间内,探索出更多行走策略来调整机器人的速度和动作,从而能使机器人的关节相互配合,平稳地进行行走。使最终机器人进行平稳地行走。