人群感知机器人的多目标强化学习导航方法

    公开(公告)号:CN116384477A

    公开(公告)日:2023-07-04

    申请号:CN202310185203.1

    申请日:2023-03-01

    Abstract: 本发明公开人群感知机器人的多目标强化学习导航方法。首先,初始化多目标强化学习参数。然后,采集得到当前环境下智能体的状态信息,并对数据进行相应的预处理。其次,将处理好的智能体的状态信息送入到价值网络输出智能体的决策动作,根据不同的目标奖励函数计算累计奖励对智能体进行评价,利用多目标强化学习算法进行价值网络参数更新。最后,判断是否到达最大训练次数,通过不断地试错学习得到良好的导航表现。本发明提出一种端到端的机器人导航框架,实现针对动态权重下多个目标间的权衡,提高了机器人在密集人群场所中的导航性能表现。

    一种基于信息预处理和强化学习的机器人避障导航方法

    公开(公告)号:CN116300909A

    公开(公告)日:2023-06-23

    申请号:CN202310185208.4

    申请日:2023-03-01

    Abstract: 本发明公开了一种基于信息预处理和强化学习的机器人避障导航方法。该方法包括以下步骤:首先,利用不同类型的神经网络层组成信息预处理模块对机器人采集的多模数据进行信息预处理;其次,将无地图环境下的机器人避障导航过程描述为马尔可夫决策过程并引入强化学习框架在仿真环境中训练机器人,设计有关多维目标的奖励函数,实现仿真环境下的避障导航功能;最后,将训练好的信息预处理模块和动作网络移植到现实环境中完成机器人的避障导航任务。本发明通过多模信息预处理模块实现了对环境更完整的感知,端到端的强化学习方法无需关于环境的先验知识,提高了无地图环境下机器人的导航表现和算法在现实环境下的泛化性。

    间歇动态事件触发下多智能体系统固定时间合围控制方法

    公开(公告)号:CN119414748A

    公开(公告)日:2025-02-11

    申请号:CN202411402719.8

    申请日:2024-10-09

    Applicant: 东南大学

    Abstract: 本发明提出了间歇动态事件触发下多智能体系统固定时间合围控制方法,所述方法包括以下步骤:步骤S1:根据实际任务,构建多智能体系统的有向拓扑图和拉普拉斯矩阵;步骤S2:构建多智能体系统的动力学模型;步骤S3:设计间歇动态事件触发下的多智能体系统固定时间合围控制器;步骤S4:使用步骤S3中设计的控制器在固定时间内实现合围控制,并且得到收敛时间上界;步骤S5:持续运行,直至完成对于多智能体系统的合围控制。

    一种基于动作空间安全映射的赛车强化学习自动驾驶方法

    公开(公告)号:CN117193293A

    公开(公告)日:2023-12-08

    申请号:CN202311057875.0

    申请日:2023-08-22

    Applicant: 东南大学

    Abstract: 一种基于动作空间安全映射的赛车强化学习自动驾驶方法,本发明采用的技术方案是使用神经网络建立赛车的自动驾驶控制器,输入赛车自身的运动状态数据和前方赛道的数据,输出对应的油门/刹车控制量和方向盘控制量。根据赛车的动力学模型,建立动作空间安全映射函数,将可能导致车辆进入危险状态的神经网络输出量转化为安全的控制量再输入赛车的控制系统。利用强化学习算法,根据奖励反馈信号对神经网络进行训练,不断更新神经网络参数,最终获得优化的赛车自动驾驶策略。

    一种基于动态匹配和绝对中位差的线特征匹配方法

    公开(公告)号:CN116597161A

    公开(公告)日:2023-08-15

    申请号:CN202310539070.3

    申请日:2023-05-15

    Applicant: 东南大学

    Abstract: 一种基于动态匹配和绝对中位差的线特征匹配方法,包括如下步骤:1)接收RGB‑D相机采集的RGB帧作为视觉输入图像;2)使用EDLines线检测器进行线特征提取;3)通过端点对线特征进行参数化;4)基于离散关键点对参数化的线特征进行描述;5)使用动态规划算法对前后帧提取的线特征进行动态匹配;6)使用绝对中位差方法估算所有线特征匹配的位移变化标准差,并基于此对错误的或低质量的线匹配进行剔除。本发明能在遮挡,旋转以及外观改变的场景中,提取足够数量的且正确的线特征匹配。

    一种基于估计偏差平均的四基站UWB平面定位算法

    公开(公告)号:CN112566021B

    公开(公告)日:2023-04-18

    申请号:CN202011396417.6

    申请日:2020-12-04

    Applicant: 东南大学

    Abstract: 本发明涉及一种基于估计偏差平均的四基站UWB平面定位算法,其包括如下步骤:定位标签向四个基站轮询获取距离数据,检查距离数据的可靠性,计算出多组位置参数和位置参数关于距离数据的梯度的模值,根据梯度模值设置每组位置参数的权重,使最终估计结果表达式对每一个基站的距离数据的偏导相等,该方案抑制测量数据波动对最终定位效果的干扰,提升了定位的准确度。

    一种提高台风轨迹预测的方法

    公开(公告)号:CN112527860B

    公开(公告)日:2022-11-18

    申请号:CN202011406564.7

    申请日:2020-12-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种提高台风轨迹预测的方法,针对台风本身运动的复杂和多变性,单个预测模型对未来的多个时刻的台风轨迹预测整体精度不高等问题,本发明采用了输入数据为过去连续多个时刻的卫星同步台风数据,通过调节不同参数和网络参数等,训练出多个评价指标相似且收敛最好的时空序列预测模型,用这些模型做多次未来每个时刻的预测,并采用更改网络结构之后的时空序列分类模型进行决策这些模型在未来每个时刻的预测作为最优值,最终将每个最优预测值整合成最后的预测数据值,最终得到未来多时刻的时空序列预测数据,得到了一个总体时序精度更高的未来多时刻台风轨迹预测数据。

    一种基于智能组件的移动机器人导航与控制方法

    公开(公告)号:CN110658816B

    公开(公告)日:2022-10-25

    申请号:CN201910920606.X

    申请日:2019-09-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于智能组件的移动机器人导航与控制方法,首先建立用于机器人导航与控制的智能组件库,其中包括用于移动机器人环境感知、路径规划和驱动控制的多种智能组件。然后根据机器人的传感器配置、任务需求和驱动形式选择相应的一组智能组件,并且通过智能组件融合技术完成移动机器人的导航与控制任务。根据任务执行的效果,可以自动调节每个智能组件的算法参数,进一步改进执行效果。本方法可以方便地应用于搭载各种传感器和具有不同驱动形式的移动机器人,在使用过程中还可以方便地改变传感器配置、更换导航算法,并且无需重新设计整套导航与控制程序,具有良好的灵活性和通用性。

    基于拓扑图结构和深度自注意力网络的行人轨迹预测方法

    公开(公告)号:CN115082896A

    公开(公告)日:2022-09-20

    申请号:CN202210741506.2

    申请日:2022-06-28

    Applicant: 东南大学

    Abstract: 基于拓扑图结构和深度自注意力网络的行人轨迹预测方法,利用图注意力网络和基于拓扑图的深度自注意力网络提取分别行人运动轨迹中的局部和全局空间交互特征,随后利用原始深度自注意力网络提取时间序列特征。为了模拟行人运动轨迹的固有不确定性和多模态特性,本发明通过在全连接网络解码器中引入高斯噪声的方式来拓展行人运动轨迹的探索空间。为了进一步提高轨迹探索空间及平滑性,将轨迹送入轨迹矫正模块进行矫正。其采用的图神经网络和基于图的深度自注意力网络相较于其他方法更能充分关注到行人运动轨迹中的各种空间交互模式,如并行,潜在避障等。相比于其他行人轨迹预测方法,本发明的社会性交互特征提取能力和多模态探索能力更加突出有效。

    一种基于图像和文本的多模态商品匹配方法

    公开(公告)号:CN115018010A

    公开(公告)日:2022-09-06

    申请号:CN202210809470.7

    申请日:2022-07-11

    Applicant: 东南大学

    Abstract: 一种基于图像和文本的多模态商品匹配方法,该方法旨在利用商品封面的图像信息和商品标题中的文本信息,找出相匹配的商品;其具体步骤:首先,使用度量学习的方法,使网络学习到具有判别性的特征;其次,分别通过图像和文本网络提取商品特征;再次,从图像、文本和多模态三个角度计算样本间特征的余弦距离,采用查询扩展的方法,实现对匹配结果的重排;最后,设置动态阈值,实现多模态结果的融合,并将满足阈值条件的样本加入到最终匹配结果中。本发明所涉及的神经网络结构和后处理方法,能够有效解决单一模态中存在的少匹配和误匹配问题。在满足匹配精确性的同时,显著提高商品的召回率。

Patent Agency Ranking