-
公开(公告)号:CN118317443A
公开(公告)日:2024-07-09
申请号:CN202410156730.4
申请日:2024-02-04
Applicant: 北京工业大学
IPC: H04W72/50 , H04W72/542 , H04W72/0453 , G06N3/0499 , G06N3/092
Abstract: 本发明公开一种异构网络多频谱协同方法、装置及介质。该方法包括:将用户测量信息输入多智能体多频段协同算法的多个智能体,执行实时强化学习单元,输出Q值给经验重放单元,同时触发计时器1;如果计时器1没有停止,经验重放单元持续进行迭代;如果计时器1停止,则将经验重放单元的结果输出目标强化学习单元,对Q值进行训练,同时触发计时器2;如果计时器2停止,目标强化学习单元将得到的Q值输出给实时强化学习单元;如果计时器2没有停止,目标强化学习单元持续进行迭代;多智能体多频谱段协同算法的多个智能体输出多个Q值,每个Q值对应一个或若干个用户的频段资源分配结果。本发明为各类型业务、通信终端和通信网络提供技术支撑。
-
公开(公告)号:CN119946884A
公开(公告)日:2025-05-06
申请号:CN202510109943.6
申请日:2025-01-23
Applicant: 北京工业大学
IPC: H04W72/50 , H04W72/542 , H04W72/0453 , G06N3/0499 , G06N3/092
Abstract: 本发明公开一种异构网络多频段协同方法、装置及介质。该方法包括:将用户测量信息输入多智能体多频段协同算法的多个智能体,执行实时强化学习单元,输出Q值给经验重放单元,同时触发计时器1;如果计时器1没有停止,经验重放单元持续进行迭代;如果计时器1停止,则将经验重放单元的结果输出目标强化学习单元,对Q值进行训练,同时触发计时器2;如果计时器2停止,目标强化学习单元将得到的Q值输出给实时强化学习单元;如果计时器2没有停止,目标强化学习单元持续进行迭代;多智能体多频谱段协同算法的多个智能体输出多个Q值,每个Q值对应一个或若干个用户的频段资源分配结果。本发明为各类型业务、通信终端和通信网络提供技术支撑。
-