一种基于迁移强化学习的海上自主水面船舶避碰决策方法

    公开(公告)号:CN115167404A

    公开(公告)日:2022-10-11

    申请号:CN202210730090.4

    申请日:2022-06-24

    Abstract: 本发明提供一种基于迁移强化学习的海上自主水面船舶避碰决策方法,包括:获取船舶航行状态及周围环境信息;基于船舶航行状态和《规则》进行船舶会遇场景划分,确定各会遇态势下的船舶推荐避让行为;考虑国际海上避碰规则与良好船艺的制约,引入碰撞危险度概念设计奖励函数,构建基于深度强化学习的船舶自主避碰决策模型;重复训练构建的模型,构建船舶避碰任务集,提出船舶避碰任务的相似度和复杂度度量模型,进行源任务筛选;通过源任务的选择和特征函数提取进行知识的获取,引入知识迁移方法加速目标任务中船舶智能体的训练,在保证避碰安全性的基础上优化决策的实时性。本发明能够有效提升船舶在复杂航行环境中的避碰决策的安全性和实时性。

Patent Agency Ranking