基于多Agent强化学习的机器人联合搜索方法

    公开(公告)号:CN102521205B

    公开(公告)日:2014-12-10

    申请号:CN201110375450.5

    申请日:2011-11-23

    Abstract: 本发明涉及一种多机器人联合目标搜索方法,具体涉及到一种基于多Agent强化学习的多机器人联合目标搜索方法。本发明是在目标位置不确定的情况下进行搜索,强化学习算法不仅加快搜索速度,而且提高搜索效率,有效避免机器人碰壁以及机器人之间发生碰撞等问题,特别适合应用于搜索危险的或人类无法到达的区域,从而达到节约搜索时间,拓展搜索区域,更好保护人身财产安全等目的。

    一种太阳能超导热管自动排气封接装置及其方法

    公开(公告)号:CN102248405B

    公开(公告)日:2013-10-02

    申请号:CN201110162300.6

    申请日:2011-06-16

    Abstract: 本发明公开了一种太阳能超导热管自动排气封接装置及其方法,包括自动加液机构、铜管挤压机构、铜管焊接机构、铜管检测机构和滚轴丝杠机构;所述自动加液机构、铜管挤压机构、铜管焊接机构和铜管检测机构通过滚轴丝杠按照并行、流水线模式依次连接。本发明还公开了一种太阳能超导热管自动排气封接方法。本发明将挤压和焊接操作分离,设置独立的操作机构,保证设备运行的安全性,并增加检测机构,自动检测超导热管的焊接质量,减少次品影响,高效、安全地实现太阳能超导热管的自动封接,保证太阳能热水器装置的效能。

    井下多机器人联合搜救的生物刺激神经网络设备及其方法

    公开(公告)号:CN102521653B

    公开(公告)日:2015-01-21

    申请号:CN201110375410.0

    申请日:2011-11-23

    Abstract: 本发明属于多机器人搜救技术领域,是人工智能与机器人技术相结合的应用,特别是涉及一种井下多机器人联合搜救的生物刺激神经网络设备及其方法,设备包括机器人、射频阅读器、摄像机、超声波传感器、无线通讯系统、存储设备、位置射频标签以及地面搜救决策系统;其方法是将射频标签应用到井下位置标记中,并利用生物刺激神经网络方法实现多机器人联合搜救,当发生矿难时,可以快速完成井下的搜索,构建井下实时地图,并制定最佳搜救路径,本发明在煤矿等井下事故人员搜救中具有极大的现实意义和应用价值。

    井下多机器人联合搜救的生物刺激神经网络设备及其方法

    公开(公告)号:CN102521653A

    公开(公告)日:2012-06-27

    申请号:CN201110375410.0

    申请日:2011-11-23

    Abstract: 本发明属于多机器人搜救技术领域,是人工智能与机器人技术相结合的应用,特别是涉及一种井下多机器人联合搜救的生物刺激神经网络设备及其方法,设备包括机器人、射频阅读器、摄像机、超声波传感器、无线通讯系统、存储设备、位置射频标签以及地面搜救决策系统;其方法是将射频标签应用到井下位置标记中,并利用生物刺激神经网络方法实现多机器人联合搜救,当发生矿难时,可以快速完成井下的搜索,构建井下实时地图,并制定最佳搜救路径,本发明在煤矿等井下事故人员搜救中具有极大的现实意义和应用价值。

    一种太阳能超导热管自动排气封接装置及其方法

    公开(公告)号:CN102248405A

    公开(公告)日:2011-11-23

    申请号:CN201110162300.6

    申请日:2011-06-16

    Abstract: 本发明公开了一种太阳能超导热管自动排气封接装置及其方法,包括自动加液机构、铜管挤压机构、铜管焊接机构、铜管检测机构和滚轴丝杠机构;所述自动加液机构、铜管挤压机构、铜管焊接机构和铜管检测机构通过滚轴丝杠按照并行、流水线模式依次连接。本发明还公开了一种太阳能超导热管自动排气封接方法。本发明将挤压和焊接操作分离,设置独立的操作机构,保证设备运行的安全性,并增加检测机构,自动检测超导热管的焊接质量,减少次品影响,高效、安全地实现太阳能超导热管的自动封接,保证太阳能热水器装置的效能。

    基于强化学习的多Agent污水处理决策支持系统

    公开(公告)号:CN102207928A

    公开(公告)日:2011-10-05

    申请号:CN201110147186.X

    申请日:2011-06-02

    Abstract: 本发明公开了一种基于强化学习的多Agent污水处理决策支持系统,将水污染源附近的污水处理厂抽象成具有一定属性的Agent主体,将强化学习与Agent概念相结合,定义强化学习的状态集、动作集;初始化强化学习中Q学习的参数,包括学习速率、折扣因子、Q值;各个Agent通过感知模块获得当前状态,并根据动作选择策略选择当前状态下最优动作;根据Q学习中的Q值公式进行Q值的计算与更新;一次学习过程结束,等待或者马上进入下一个学习过程,直到Q值收敛,得到最优决策。本发明从整个污水处理系统的全局出发,宏观调配污水处理厂的使用情况,具有较高的灵活性与自适应能力,并且可扩展性也非常高,具有较高的实用价值。

    基于强化学习的多Agent污水处理决策支持系统

    公开(公告)号:CN102207928B

    公开(公告)日:2013-04-24

    申请号:CN201110147186.X

    申请日:2011-06-02

    Abstract: 本发明公开了一种基于强化学习的多Agent污水处理决策支持系统,将水污染源附近的污水处理厂抽象成具有一定属性的Agent主体,将强化学习与Agent概念相结合,定义强化学习的状态集、动作集;初始化强化学习中Q学习的参数,包括学习速率、折扣因子、Q值;各个Agent通过感知模块获得当前状态,并根据动作选择策略选择当前状态下最优动作;根据Q学习中的Q值公式进行Q值的计算与更新;一次学习过程结束,等待或者马上进入下一个学习过程,直到Q值收敛,得到最优决策。本发明从整个污水处理系统的全局出发,宏观调配污水处理厂的使用情况,具有较高的灵活性与自适应能力,并且可扩展性也非常高,具有较高的实用价值。

    基于多Agent强化学习的机器人联合搜索系统

    公开(公告)号:CN102521205A

    公开(公告)日:2012-06-27

    申请号:CN201110375450.5

    申请日:2011-11-23

    Abstract: 本发明涉及一种多机器人联合目标搜索系统,具体涉及到一种基于多Agent强化学习的多机器人联合目标搜索系统。本发明是在目标位置不确定的情况下进行搜索,强化学习算法不仅加快搜索速度,而且提高搜索效率,有效避免机器人碰壁以及机器人之间发生碰撞等问题,特别适合应用于搜索危险的或人类无法到达的区域,从而达到节约搜索时间,拓展搜索区域,更好保护人身财产安全等目的。

Patent Agency Ranking