Patent search ap:("上海交通大学") AND inv:"赵小虎" Page 1

1.

发明公开
时空任务驱动下多智能体强化学习任务规划与控制方法审中-实审

公开(公告)号：CN119472783A

公开(公告)日：2025-02-18

申请号：CN202411587548.0

申请日：2024-11-08

Applicant: 上海交通大学

Inventor： 阳逸潇 , 邹媛媛 , 王高尚 , 杨亚茹 , 杨天歌 , 赵小虎

IPC: G05D1/695

Abstract: 本发明提供了时空任务驱动下多智能体强化学习任务规划与控制方法，包括：S1，建立多智能体系统下信号时序逻辑任务的强化学习控制器训练架构；S2，建立多智能体系统间的自注意力动作补偿机制；S3,根据任务框架构造信号时序逻辑任务对应的鲁棒值过滤基线；S4，根据环境信息对智能体动作生成软约束；S5，根据补偿动作程度构造多目标任务的冲突检测与任务重规划机制；S6，基于约束条件，迭代训练控制器参数以在线给出控制律满足STL任务需求。本发明利用强化学习的方式学习控制器参数，适应复杂环境下在线求解控制律，给出的控制律更加符合外部环境和内部动态系统的实际情况，大大减少在线计算控制律的负担。

2.

发明公开
一种混合车队动态定价场景下实时控制策略控制方法审中-实审

公开(公告)号：CN116433140A

公开(公告)日：2023-07-14

申请号：CN202310411422.7

申请日：2023-04-17

Applicant: 上海交通大学

Inventor： 邹媛媛 , 王宇杰 , 赵小虎 , 王高尚 , 李少远

IPC: G06Q10/0834 , G06Q10/0835 , G06Q10/0631 , G06N3/08 , G08G1/00

Abstract: 本发明提供一种混合车队动态定价场景下实时控制策略控制方法，包括：建立混合车队实时控制策略的模型；建立混合车队实时控制策略的优化问题；提出深度化学习框架求解混合车队实时控制策略；改进深度化学习框架求解混合车队实时控制策略。本发明能够对复杂的车队运营场景和人类驾驶车辆与自动驾驶车辆的相互影响进行描述；能够对车队运营的具体操作进行描述；将混合车队的实时控制策略问题表述为优化问题，指向清晰、目标明确；分析并改进了优化问题的求解难度，提高了策略获取效率；采用深度强化学习的框架，将订单的定价和对人类驾驶车辆的激励与车辆移动去向分开，减轻强化学习训练压力，提高混合车队的运营表现。

3.

发明公开
多动态任务目标点下的无人机路径规划方法有权

公开(公告)号：CN110470301A

公开(公告)日：2019-11-19

申请号：CN201910742860.5

申请日：2019-08-13

Applicant: 上海交通大学

Inventor： 周筱忆 , 邹媛媛 , 李少远 , 肖春晖 , 赵小虎

IPC: G01C21/20 , G06N3/04 , G06Q10/04

Abstract: 本发明提供了一种多动态任务目标点下的无人机路径规划方法，包括如下步骤：训练SOM神经网络，确定获胜点、访问点及访问序列；确定飞行方向以及最优路径；迭代；滚动优化。本发明针对信使机制下的无人机路径规划问题，无人机需要周期性地遍历所有无人车并进行信息交换，考虑无人机的运动曲率约束、无人车的动态特性以及无人车的通讯范围等约束条件，利用无监督的竞争型神经网络SOM求解访问顺序和访问点，优化无人机的飞行路径，并在无人机遍历无人车的过程中采用滚动优化策略，使无人机每次访问一个无人车后重新求解优化问题，从而实现在无人机访问的过程中动态地更新最优路径，持续保证决策的优越性。

4.

发明授权
多动态任务目标点下的无人机路径规划方法有权

公开(公告)号：CN110470301B

公开(公告)日：2020-12-11

申请号：CN201910742860.5

申请日：2019-08-13

Applicant: 上海交通大学

Inventor： 周筱忆 , 邹媛媛 , 李少远 , 肖春晖 , 赵小虎

IPC: G01C21/20 , G06N3/04 , G06Q10/04

Abstract: 本发明提供了一种多动态任务目标点下的无人机路径规划方法，包括如下步骤：训练SOM神经网络，确定获胜点、访问点及访问序列；确定飞行方向以及最优路径；迭代；滚动优化。本发明针对信使机制下的无人机路径规划问题，无人机需要周期性地遍历所有无人车并进行信息交换，考虑无人机的运动曲率约束、无人车的动态特性以及无人车的通讯范围等约束条件，利用无监督的竞争型神经网络SOM求解访问顺序和访问点，优化无人机的飞行路径，并在无人机遍历无人车的过程中采用滚动优化策略，使无人机每次访问一个无人车后重新求解优化问题，从而实现在无人机访问的过程中动态地更新最优路径，持续保证决策的优越性。

Patent Agency Ranking