-
公开(公告)号:CN118885286A
公开(公告)日:2024-11-01
申请号:CN202410777405.X
申请日:2024-06-17
Applicant: 哈尔滨工业大学(威海)
Abstract: 本发明涉及车辆系统资源管理技术领域,具体的说是一种利用参数化深度强化学习来解决实时卸载决策问题,以最小化系统的长期延迟、能耗和成本的基于P‑DQN的车辆边缘计算系统资源管理方法,其特征在于,构建一个包含本地、边缘服务器和云层的三层任务卸载系统;构建了一个联合考虑延迟、能耗和成本的优化问题,并将问题框架化为马尔可夫决策过程MDP,设计了状态空间和奖励函数,并引入了一个参数化的行为空间,有效管理混合行为空间;此外,提出基于参数化Q网络P‑DQN的方法来解决优化问题。