一种基于信息预处理和强化学习的机器人避障导航方法

    公开(公告)号:CN116300909A

    公开(公告)日:2023-06-23

    申请号:CN202310185208.4

    申请日:2023-03-01

    Abstract: 本发明公开了一种基于信息预处理和强化学习的机器人避障导航方法。该方法包括以下步骤:首先,利用不同类型的神经网络层组成信息预处理模块对机器人采集的多模数据进行信息预处理;其次,将无地图环境下的机器人避障导航过程描述为马尔可夫决策过程并引入强化学习框架在仿真环境中训练机器人,设计有关多维目标的奖励函数,实现仿真环境下的避障导航功能;最后,将训练好的信息预处理模块和动作网络移植到现实环境中完成机器人的避障导航任务。本发明通过多模信息预处理模块实现了对环境更完整的感知,端到端的强化学习方法无需关于环境的先验知识,提高了无地图环境下机器人的导航表现和算法在现实环境下的泛化性。

    一种四旋翼无人机积分补偿确定性策略梯度控制方法

    公开(公告)号:CN112034872B

    公开(公告)日:2023-01-17

    申请号:CN202010895952.X

    申请日:2020-08-31

    Applicant: 东南大学

    Abstract: 本专利公开了一种四旋翼无人机积分补偿确定性策略梯度控制方法。本发明使用深度神经网络对四旋翼无人机的控制器进行表示,将四旋翼无人机的运动状态通过深度神经网络直接映射到四个电机的控制指令,使用机器学习算法根据奖励反馈信号对深度神经网络进行训练,最终获得满足控制需求的控制器。本方法可以直接使用带有复杂非线性特性的四旋翼无人机数学模型进行训练,通过引入积分补偿机制结合确定性策略梯度算法进行训练,可以提高训练得到的控制器的鲁棒性和精确性。

    一种基于端边云协同的智能体控制方法

    公开(公告)号:CN112099510B

    公开(公告)日:2022-10-18

    申请号:CN202011021858.8

    申请日:2020-09-25

    Applicant: 东南大学

    Abstract: 一种基于端边云协同的智能体控制方法。首先分别建立智能体本地端感知模块、边缘端的感知模块,并将感知信息发送到云端。本地端对周边智能体行为意图和轨迹进行预判,边缘端根据本地端感知信息的特征提取和边缘端感知信息进行实时学习和训练,云端基于历史数据进行离线的路径规划和控制。在运行过程中,本地端的控制调度器根据实时的多个智能体位置,调度本地端/边缘端/云端接管控制。本方法具有良好的场景适应能力,在应用过程中可以方便的切换本地端、边缘端和云端的控制,使得消耗最小的计算资源获得有效的控制效果。由于该方法将一部分具有共性的计算任务迁移到路边边缘服务器和云服务器中,该方法的使用还可以降低目前单台智能体造价。

    一种针对船舶航向保持的自适应动态面算法

    公开(公告)号:CN111880413B

    公开(公告)日:2022-09-23

    申请号:CN202010805693.7

    申请日:2020-08-12

    Applicant: 东南大学

    Abstract: 本发明公开了一种针对船舶航向保持的自适应动态面算法,包括如下步骤:步骤S1:建立受控船舶的数学模型;步骤S2:针对船舶系统的非线性项、未知控制方向和未建模动态设计自适应控制器;步骤S3:自适应控制器有效性的证明;步骤S4:将所设计的控制输入到船舶系统中,验证结果。本发明解决了带有未建模状态的船舶系统在控制方向未知的情况下的稳定性控制问题,利用径向基神经网络近似了包含有未建模状态的非线性项,设计的针对控制方向未知的船舶系统的自适应动态面算法,有良好的经济效益和社会效益,适合推广使用。

    一种基于知识图谱推理的场所识别方法

    公开(公告)号:CN112966823A

    公开(公告)日:2021-06-15

    申请号:CN202011556111.2

    申请日:2020-12-24

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于知识图谱推理的场所识别方法,在给出场所领域知识图谱构建方法的基础上,提出了一种基于知识图谱推理且可融合多种异类环境信息的一般化场所识别方法,步骤如下:(1)从各类异源信息中提取构成场所的主要物体、产生的事件、空间结构等主要线索,并将这些线索以自然语言文字进行描述;(2)利用自然语言处理方法对上述描述进行筛选,形成场所描述实体;(3)结合上述描述实体在实际环境中的发生频率,组建场所领域知识图谱;(4)运用深度神经网络实现基于知识图谱的推理分类,给出最终识别结果;本发明通过使用知识图谱推理方法,提升了场所识别准确率,并极大提升了场所识别过程中的语义可解释性。

    一种基于深度强化学习的智能电热水器保温档负荷控制方法

    公开(公告)号:CN112510719A

    公开(公告)日:2021-03-16

    申请号:CN202011408553.2

    申请日:2020-12-05

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于深度强化学习的智能电热水器保温档负荷控制方法,包括以下步骤:采用LSTM网络利用过去48小时电价预测未来24小时电价;采用基于DQN的深度强化学习算法,将电力消耗和用户满意度同时作为好策略的衡量标准,并根据用户自身的需求调节二者所占比重。根据所预测的电价训练电热水器保温档负荷控制智能体学习得到使得奖励值最高的策略,使其在高电价时选择较低功率,低电价时选择较高功率,在尽可能保证用户满意度的同时节省更多电力消耗,以获得一个性能优良且适用性较高的电热水器负荷控制智能体。

    一种基于智能组件的移动机器人导航与控制方法

    公开(公告)号:CN110658816A

    公开(公告)日:2020-01-07

    申请号:CN201910920606.X

    申请日:2019-09-27

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于智能组件的移动机器人导航与控制方法,首先建立用于机器人导航与控制的智能组件库,其中包括用于移动机器人环境感知、路径规划和驱动控制的多种智能组件。然后根据机器人的传感器配置、任务需求和驱动形式选择相应的一组智能组件,并且通过智能组件融合技术完成移动机器人的导航与控制任务。根据任务执行的效果,可以自动调节每个智能组件的算法参数,进一步改进执行效果。本方法可以方便地应用于搭载各种传感器和具有不同驱动形式的移动机器人,在使用过程中还可以方便地改变传感器配置、更换导航算法,并且无需重新设计整套导航与控制程序,具有良好的灵活性和通用性。

    一种基于实时丢包信息触发的重传次数动态调整的方法

    公开(公告)号:CN108768591A

    公开(公告)日:2018-11-06

    申请号:CN201810521031.X

    申请日:2018-05-28

    Applicant: 东南大学

    CPC classification number: H04L1/0006 H04L1/18

    Abstract: 本发明提出一种基于实时丢包信息触发的重传次数动态调整的方法,包括步骤:收集离散线性时不变系统的系统状态,将其经过卡尔曼滤波处理后传输到远程估计器;根据数据包到达或丢失,远程状态估计的误差协方差将收敛或急剧增大的特点,设计重传需求程度的指标,并自主选择该指标的变化函数以调整指标的增减幅;针对不断变化的需求程度指标,设计重传次数的增减触发阈值;在传输过程中,当需求程度指标到达增减触发阈值时,重传次数将据此增减,并更新用于下一次数据传输。根据本发明的算法,在能量消耗相同的情况下,该动态调整重传次数算法比平均分配重传次数算法更能优化远程估计的性能。

    一种基于类Haar中间层滤波特征的行人检测方法及装置

    公开(公告)号:CN105760858A

    公开(公告)日:2016-07-13

    申请号:CN201610160605.6

    申请日:2016-03-21

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于类Haar中间层滤波特征的行人检测方法。首先提取训练图像集中各训练图像的目标特征,并用所提取的目标特征数据对基于决策树的Adaboost分类器进行训练,得到分类模型;然后提取待检测图像在多个尺度下的目标特征并输入所述分类模型,得到行人检测结果;目标特征的提取方法具体如下:对原始图像分别提取多个不同的通道特征,得到该原始图像的多幅通道特征图;对各通道特征图分别进行降采样;对每一幅降采样后的通道特征图,利用一组预设的类Haar特征模板分别提取该通道特征图的相应类Haar特征;将该原始图像的所有类Haar特征聚合为该原始图像的目标特征。本发明还公开了一种基于类Haar中间层滤波特征的行人检测。本发明可有效提高行人检测性能。

    一种基于韦伯法则的局部多值模式的人脸识别方法

    公开(公告)号:CN103761507A

    公开(公告)日:2014-04-30

    申请号:CN201410001390.4

    申请日:2014-01-03

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于韦伯法则的局部多值模式的人脸识别方法,分为训练阶段和识别阶段;训练阶段,首先要提取训练样本的特征,对样本进行三级编码;然后将三级编码都转换为Uniform模式,然后对经过三级编码后的图像分别进行均匀的、无交叠的分块处理,再对每个分块提取特征直方图,将每个块每级的特征直方图连接得到一幅人脸图像的整体特征直方图;识别阶段,按照上述特征提取的方法提取待测样本的特征直方图作为待测特征,然后运用χ2概率统计和最近邻分类方法,对待测样本进行识别。本发明在人脸识别中对人脸的光照和姿态具有更佳的鲁棒性,并提高了人脸的识别率。

Patent Agency Ranking