多无人艇追逃博弈控制方法
    21.
    发明公开

    公开(公告)号:CN115903820A

    公开(公告)日:2023-04-04

    申请号:CN202211507056.7

    申请日:2022-11-29

    Applicant: 上海大学

    Abstract: 本发明提供了一种多无人艇追逃博弈控制方法,包括:无人艇追逃时,在追击方的控制算法中引入序贯决策,进行“自我博弈”;观测器根据控制器给出的最优控制,解算观测器的最优响应,以逼近追击方群体中的外部干扰及系统不确定性;以及控制器接收观测器的最优响应,根据所述最优响应重新解算追击方的最优控制,如此交替进行,形成序贯决策;在该序贯决策基础之上,设计一种新型奖励函数形式并应用强化学习控制算法,完成多无人艇围捕任务。

    基于Actor-Critic-Advantage网络的无人艇轨迹跟踪控制方法

    公开(公告)号:CN115793455A

    公开(公告)日:2023-03-14

    申请号:CN202211507269.X

    申请日:2022-11-29

    Applicant: 上海大学

    Abstract: 本发明提供了一种基于Actor‑Critic‑Advantage网络的无人艇轨迹跟踪控制方法,包括:在Actor‑Critic网络基础上引入优势函数估计网络,形成新型Actor‑Critic‑Advantage网络;训练新型Actor‑Critic‑Advantage网络进行无人艇轨迹跟踪控制;无人艇轨迹跟踪训练采用单步获取策略梯度方式,利用优势函数估计网络输出值得到策略梯度更新策略网络;基于反步法求解虚拟控制律设计分段奖励函数;奖励函数中引入虚拟控制律,训练无人艇的速度输出趋向于虚拟控制律。

    一种无人机编队控制方法及系统

    公开(公告)号:CN118760210B

    公开(公告)日:2025-04-25

    申请号:CN202411028859.3

    申请日:2024-07-29

    Applicant: 上海大学

    Abstract: 本发明涉及无人机控制技术领域,提出一种无人机编队控制方法及系统。该方法包括:根据无人机集群的多个无人机的全局路径生成多个无人机飞行走廊;根据所述无人机飞行走廊与无人机集群的主无人机的全局路径之间的包含关系,确定无人机是否处于陷阱中;当存在处于陷阱中的受困无人机时,构造所述受困无人机与所述主无人机之间的连接路径,根据所述连接路径生成受困无人机飞行走廊,并且确定临时导航点,使无人机集群飞向临时导航点处;以及构造并求解优化问题,以将无人机集群约束在主无人机飞行走廊中,使得无人机集群绕过陷阱。本发明有效解决无人机在连续性障碍中的困境问题,适用于各种复杂环境中的无人机应用,具有广泛的实际应用价值。

    无人艇集群的围堵控制方法

    公开(公告)号:CN114779647B

    公开(公告)日:2025-04-25

    申请号:CN202210506176.9

    申请日:2022-05-11

    Applicant: 上海大学

    Abstract: 本发明提供了一种无人艇集群的围堵控制方法,将无人艇集群分布式协同围堵模型分解为外层控制策略和内层控制策略。基于无人艇之间的信息传输和交互,使用分布式控制架构,通过无人艇集群中领导者无人艇和跟随者无人艇信息交互,使得所有无人艇的期望速度一致,以将无人艇集群的围堵模型转化为基于虚拟中心的多智能体系统分布式协同编队模型,获取领导者‑跟随者分布式一致性控制算法以及固定几何队形列阵对目标无人艇进行有效围堵;基于无人艇在复杂海域中所受到的外界环境扰动,将滑模控制施加到无人艇集群分布式协同围堵控制的内层控制中,在环境扰动的基础上,各无人艇能够跟踪到达到几何队形中的目标位置,实现对目标无人艇的稳定跟踪控制。

    一种用于自动驾驶赛车的轨迹引导强化学习方法

    公开(公告)号:CN119670843A

    公开(公告)日:2025-03-21

    申请号:CN202411834668.6

    申请日:2024-12-13

    Applicant: 上海大学

    Abstract: 本发明涉及一种用于自动驾驶赛车的轨迹引导强化学习方法,包括:模拟赛道环境,并确定描述智能体动态行为的运动模型;设置智能体的动作空间和状态空间;使用TD3算法建立轨迹引导强化学习架构,其中轨迹引导强化学习架构具有评价网络和执行网络;在轨迹引导强化学习架构中引入摩擦系数的不确定性对轨迹引导强化学习架构进行循环训练,使得智能体通过与环境的交互逐步学习如何跟踪轨迹,并适应不同的摩擦系数条件;以及对轨迹引导强化学习架构的评价网络和执行网络的参数进行优化。

    一种动态物体抑制的视觉里程测量方法、系统和介质

    公开(公告)号:CN119090922A

    公开(公告)日:2024-12-06

    申请号:CN202411201208.X

    申请日:2024-08-29

    Applicant: 上海大学

    Abstract: 本发明涉及一种动态物体抑制的视觉里程测量方法、系统和介质,包括以下步骤:获取两个连续的输入图像帧,输入动态物体抑制的视觉里程测量模型,获得相机位姿变化;其中,所述动态物体抑制的视觉里程测量模型包括依次相连的匹配网络、动态检测网络和位姿估计网络,所述匹配网络用于估计前向光流和后向光流,根据前向光流和后向光流进行光流一致性检测,获得光流前向一致性和光流后向一致性;所述动态检测网络基于光流前向一致性和光流后向一致性生成概率图,将概率图转化为二值分割掩模以优化前向光流;所述位姿估计网络用于根据优化后的前向光流输出相机位姿变化。与现有技术相比,本发明可以进一步提高动态环境下视觉里程测量的准确性和可靠性。

    基于模型扰动的线性二次控制系统的隐私保护方法

    公开(公告)号:CN116132182A

    公开(公告)日:2023-05-16

    申请号:CN202310133196.0

    申请日:2023-02-20

    Applicant: 上海大学

    Abstract: 本发明提供了一种基于模型扰动的线性二次控制系统的隐私保护方法,包括:根据云和客户端之间的系统知识是不对称的问题设置,故意通知云错误的系统模型;引入系统观测矩阵误差,根据存在的状态估计固有误差界和已有的隐私保护方法,拓宽云和客户端系统知识不对称情况下隐私保护方法设计的覆盖面;客户端向云发送处理过的数据代替本地系统的原始信息序列;根据线性二次高斯问题,获取线性变换和模型参数扰动的协同设计对隐私保护与控制性能权衡的影响。

    一种针对信息物理系统远程状态估计的拒绝服务攻击方法

    公开(公告)号:CN115840363A

    公开(公告)日:2023-03-24

    申请号:CN202211555276.7

    申请日:2022-12-06

    Applicant: 上海大学

    Abstract: 本发明提供了一种针对信息物理系统远程状态估计的拒绝服务攻击方法,包括:构建包含多个子系统的信息物理系统模型,构建相应的传感器模型、信道传输模型和远程状态估计模型;根据各个子系统的状态信息分别为各个子系统设置权重,并根据攻击者资源受限情况对攻击者进行网络攻击的资源进行建模;根据整个系统远程状态的估计准确性,构建针对包含多个子系统的信息物理系统的攻击效果指标,从而构建优化问题:在攻击者资源受限情况下,使得状态估计误差最大化;通过解决优化问题,得到拒绝服务攻击的最优攻击策略。

Patent Agency Ranking