-
公开(公告)号:CN116938732A
公开(公告)日:2023-10-24
申请号:CN202310991392.1
申请日:2023-08-08
Applicant: 西北工业大学
Abstract: 本发明公开了一种基于强化学习算法的通信拓扑优化方法,属于多智能体系统技术领域,包括以下步骤:S101、构建基于强化学习算法的最优通信拓扑生成框架;S102、设计基于通信距离和收敛时间的通讯拓扑评价函数,利用评价函数的值作为学习最优策略更新规则的奖励值;S103、改变通信拓扑,根据多智能体系统的运行结果选择出最优的通信拓扑结构,保证多智能体系统稳定并提高系统控制器的性能。通过上述方式,本发明融合强化学习算法DQN生成最优通信拓扑,充分考虑了多智能体系统的控制器性能和通信成本,在保证系统的稳定性前提下,大幅提高了系统控制器的性能,减少了系统收敛的时间,有效降低了智能体之间的通信成本。