基于点的部分可观察马尔可夫决策过程的预处理方法

    公开(公告)号:CN101398914A

    公开(公告)日:2009-04-01

    申请号:CN200810194868.4

    申请日:2008-11-10

    Applicant: 南京大学

    Abstract: 本发明的基于点的部分可观察马尔可夫决策过程的预处理方法,包括如下步骤:1.迭代之前的预处理:a.通过与环境的随机交互来采样点集;b.计算并存储采样点的奖赏函数;c.计算并存储伪继承点;d.结束;2.每步迭代的预处理:e.计算并存储基向量;f.结束;3.单点单步迭代:g.计算每个采样点的奖赏值表和候选向量表;h.计算最优动作并获取基向量;i.用误差项修正基向量;j、结束。本发明的基于点的部分可观察马尔可夫决策过程的预处理方法对每个样本信念点作预处理,而且提出了基向量的概念,避免了大量重复和无意义计算,将算法速度提升了2~4倍。

Patent Agency Ranking