Patent search ap:("电子科技大学") AND inv:"万海川" Page 1

1.

发明公开
一种迭代步长可变的多步Q学习自适应算法失效

公开(公告)号：CN104794359A

公开(公告)日：2015-07-22

申请号：CN201510212647.5

申请日：2015-04-29

Applicant: 电子科技大学

Inventor： 贺知明 , 万海川 , 高振 , 杨庆 , 肖雪冬

IPC: G06F19/00

Abstract: 本发明属于雷达信号处理领域，提出一种迭代步长可变的多步Q学习自适应算法，用以解决现有Q学习算法环境适应性差，与急剧变化环境无法工作的问题。本发明提出将步长(最大迭代次数)的大小设置为环境的函数，根据环境的变化程度来决定步长的大小；因此，本发明能够迅速地适应环境，当环境急剧变化的时候，采用更多步的信息来更新当前Q值，有效提高算法预见能力；同时，当环境变化很细微时，采用较少步的信息来更新Q值，有效减少算法复杂度；有效提高算法环境适应能力。

2.

发明授权
一种迭代步长可变的多步Q学习自适应方法失效

公开(公告)号：CN104794359B

公开(公告)日：2017-12-15

申请号：CN201510212647.5

申请日：2015-04-29

Applicant: 电子科技大学

Inventor： 贺知明 , 万海川 , 高振 , 杨庆 , 肖雪冬

IPC: G06F19/00

Abstract: 本发明属于雷达信号处理领域，提出一种迭代步长可变的多步Q学习自适应方法，用以解决现有Q学习算法环境适应性差，与急剧变化环境无法工作的问题。本发明提出将步长(最大迭代次数)的大小设置为环境的函数，根据环境的变化程度来决定步长的大小；因此，本发明能够迅速地适应环境，当环境急剧变化的时候，采用更多步的信息来更新当前Q值，有效提高算法预见能力；同时，当环境变化很细微时，采用较少步的信息来更新Q值，有效减少算法复杂度；有效提高算法环境适应能力。

Patent Agency Ranking