基于双时间尺度强化学习网络模态配置与调整方法及装置

    公开(公告)号:CN120075071A

    公开(公告)日:2025-05-30

    申请号:CN202510191064.2

    申请日:2025-02-20

    Abstract: 本发明提供一种基于双时间尺度强化学习网络模态配置与调整方法及装置,涉及通信技术领域。该方法包括:构建无人机辅助网络模态的系统模型;根据系统模型构建优化问题模型;将优化问题模型在强化学习的框架下重构为双时间尺度马尔科夫决策过程;通过基于双时间尺度强化学习的方案进行求解。本发明将优化问题解耦为网络模态级和用户级两个不同时间尺度上的优化子问题,并基于强化学习中的评论家网络被用于在某个特定状态下期望的累计折扣奖励的特性,利用评论家网络预测网络模态参数的重新配置与调整的收益,然后通过将其与网络模态参数的重新配置与调整的成本相比较,实现了网络模态参数的自适应动态配置与调整。

Patent Agency Ranking