一种面向异构环境的基于深度强化学习的轨迹定位方法

    公开(公告)号:CN114727229A

    公开(公告)日:2022-07-08

    申请号:CN202210325226.3

    申请日:2022-03-30

    Abstract: 本发明属于室内定位技术领域,具体是涉及一种面向异构环境的基于深度强化学习的轨迹定位方法。本发明充分利用了环境中的观测和智能体自身的历史动态信息,以智能体的位置、环境中具有设备异构性的RSS向量和过去n个时刻的历史动作为状态,用于动作的选择。再基于近场条件选择强于RSS阈值对应的APs,以构成选定的APs集合,再根据集合的大小计算最终奖赏值。依据MDP中设计的各要素对智能体的位置进行估计,并以奖赏值为学习导向基于经验重放机制和目标网络进行深度强化学习算法的迭代训练。本发明基于路径损耗模型得到具有设备异构性的仿真RSS数据,实验结果证明本发明所提方法能够实现较高的定位精度,并对处理异构RSS数据也具有一定的鲁棒性。

    一种室内不确定系统的定位和跟踪方法

    公开(公告)号:CN116047896A

    公开(公告)日:2023-05-02

    申请号:CN202211279258.0

    申请日:2022-10-19

    Abstract: 本发明属于室内目标跟踪技术领域,具体是涉及一种室内不确定系统的定位和跟踪方法。本发明测量噪声与多源干扰下二阶非线性系统的模型相结合。首先通过最小二乘法得到位置信息的先验预估值,用于后续状态预估器的校准。然后设计基于径向基神经网络状态预估器同时对系统受到的集总干扰和系统的全部状态进行估计,得到一个相对于先验预测值更加平滑且准确的定位结果。最后使用预估器输出的系统状态以及集总干扰的预估值设计反步法控制律,驱动系统进行预设轨迹的跟踪。仿真结果表明所提出方法能够在测量噪声与多源干扰下获得准确且连续的定位、跟踪结果。

Patent Agency Ranking