-
公开(公告)号:CN118963908A
公开(公告)日:2024-11-15
申请号:CN202410922655.8
申请日:2024-07-10
Applicant: 西安交通大学
Abstract: 本发明公开了面向多倍速仿真器的时间同步强化学习环境封装方法及系统,该系统包括仿真环境管理器、仿真环境客户端、封装服务端、时间同步机制;所述仿真环境管理器用于提供用户对仿真环境进行细粒度控制的手段,能让用户使用程序或脚本管理仿真环境的运行;所述环境客户端用于实现强化学习算法与仿真器的实时数据交互;所述封装服务端用于提供标准化的接口操作,内嵌时间同步机制;所述时间同步机制用于保障仿真器和强化学习算法的时间同步,确保智能体的决策与仿真环境的状态变化同步。本发明能实现多倍速仿真器中的时间同步,提高强化学习算法的学习效率和决策质量,具有重要的现实意义和应用前景。