一种迭代步长可变的多步Q学习自适应算法

    公开(公告)号:CN104794359A

    公开(公告)日:2015-07-22

    申请号:CN201510212647.5

    申请日:2015-04-29

    Abstract: 本发明属于雷达信号处理领域,提出一种迭代步长可变的多步Q学习自适应算法,用以解决现有Q学习算法环境适应性差,与急剧变化环境无法工作的问题。本发明提出将步长(最大迭代次数)的大小设置为环境的函数,根据环境的变化程度来决定步长的大小;因此,本发明能够迅速地适应环境,当环境急剧变化的时候,采用更多步的信息来更新当前Q值,有效提高算法预见能力;同时,当环境变化很细微时,采用较少步的信息来更新Q值,有效减少算法复杂度;有效提高算法环境适应能力。

    一种迭代步长可变的多步Q学习自适应方法

    公开(公告)号:CN104794359B

    公开(公告)日:2017-12-15

    申请号:CN201510212647.5

    申请日:2015-04-29

    Abstract: 本发明属于雷达信号处理领域,提出一种迭代步长可变的多步Q学习自适应方法,用以解决现有Q学习算法环境适应性差,与急剧变化环境无法工作的问题。本发明提出将步长(最大迭代次数)的大小设置为环境的函数,根据环境的变化程度来决定步长的大小;因此,本发明能够迅速地适应环境,当环境急剧变化的时候,采用更多步的信息来更新当前Q值,有效提高算法预见能力;同时,当环境变化很细微时,采用较少步的信息来更新Q值,有效减少算法复杂度;有效提高算法环境适应能力。

Patent Agency Ranking