基于柔性动作-评价算法的滚珠丝杠进给系统伺服参数优化方法及设备

    公开(公告)号:CN119987285A

    公开(公告)日:2025-05-13

    申请号:CN202510092964.1

    申请日:2025-01-21

    Abstract: 本发明属于伺服控制优化相关技术领域,其公开了一种基于柔性动作‑评价算法的滚珠丝杠进给系统伺服参数优化方法及设备,该方法包括以下步骤:(1)构建基于Actor‑Critic框架的SAC算法的智能体网络,所述智能体网络引入了最大熵;(2)通过环境搜索接口将滚珠丝杠进给系统的仿真模型和SAC算法的智能体网络关联,并训练SAC算法的智能体网络,继而采用训练完成的智能体网络获得优化的伺服参数。使用的SAC算法引入了最大熵概念,在探索最大累计奖励值的同时,探索随机策略的最大熵,拓宽了智能体网络的探索空间,提高探索的随机性,相较于启发式算法和其他深度强化学习算法而言,不易陷入局部最优。

Patent Agency Ranking