-
公开(公告)号:CN109257429A
公开(公告)日:2019-01-22
申请号:CN201811143682.6
申请日:2018-09-25
Applicant: 南京大学
Abstract: 本发明是一种基于深度强化学习的计算卸载调度方法,为物联网设备提供了一种计算卸载作出卸载决策方法,包括针对计算卸载的基本模型,对需要卸载的各个方面进行决策。基于不同的优化目标,通过改变价值函数,以达到不同的优化目标。本算法中的Deep-SARSA算法相似于DQN算法是结合强化学习与深度学习的深度强化学习算法,在配合了经验池可以有效的将卸载状态与卸载动作转变为深度学习的可训练样本。本发明能够有效的对不限维度的卸载状态模型进行机器学习,降低学习的复杂度,该方法使用神经网络作为Q值得线性逼近器,可以有效的提高训练速度,减少训练所需要的样本,该方法能有效的在既定模型和优化目标下,通过深度强化学习,作出最优的决策。