-
公开(公告)号:CN119227773A
公开(公告)日:2024-12-31
申请号:CN202411379921.3
申请日:2024-09-30
Applicant: 电子科技大学
IPC: G06N3/092 , G06F18/22 , G06N3/044 , G06N3/0442 , G06N3/0499 , G06N3/047 , G06N3/042 , G06N3/045
Abstract: 本发明公开了一种基于行为体行为特征相似性的多智能体强化学习协作方法,在该模型中,智能体之间的相互作用被建立为一个图神经网络。具体来说,提出了皮尔逊相关系数来计算主体历史轨迹的相似性,用于建模图神经网络中边的权值,作为确定其行为共同认知的一种手段;此外,利用结构化的状态信息互补模块,该模块主要依赖于基于自注意的变压器‑编码器架构,融合了其他智能体的观察和行动,以增强智能体的策略网络的表示能力。该模型有效地增强主体之间的协作行为,提高协同模型的训练效率。