一种基于强化学习的图像比对识别方法及设备

    公开(公告)号:CN117523359A

    公开(公告)日:2024-02-06

    申请号:CN202311541915.9

    申请日:2023-11-16

    Abstract: 本发明属于智能体视觉导航相关技术领域,其公开了一种基于强化学习的图像比对识别方法及设备,包括以下步骤:(1)将目标识别的过程设计成MDP问题;(2)设计融合蓄水池采样方法的域随机化方法,采样得到环境特征域随机化后的多个特征数值;(3)逐步增加环境变量因素和任务难度;(4)采用奖励函数对智能体产生的策略进行评价;(5)设计经验回放机制,并设置一个经验缓存区;(6)利用对动作的随机采样方法使智能体与环境进行交互以获取大量初始经验,同时采用网络损失的经验回放机制筛选经验池中的经验进行学习;(7)动态调节智能体学习过程中的探索欲系数,进而实现图像比对识别。本发明提高了目标识别的泛化能力。

    非质点化多智能体避碰路径规划方法及其规划系统

    公开(公告)号:CN116518998A

    公开(公告)日:2023-08-01

    申请号:CN202310548379.9

    申请日:2023-05-12

    Abstract: 本发明公开了一种非质点化多智能体避碰路径规划方法及其规划系统、电子设备、计算机可读存储介质,属于多智能体路径规划技术领域。其中,规划方法包括获取具有多个节点的拓扑地图;在拓扑地图上为每个智能体规划路径,形成当前路径集;判断当前路径集中是否存在碰撞冲突,若是,则重新规划,若否,结束规划,输出当前路径集;其中,碰撞冲突包括相遇冲突、异边同向冲突和异边异向冲突中的任一种;当判断两智能体异边同向冲突或异边异向冲突时,将各智能体视为体积膨胀的膨胀圆并判断对应的膨胀圆是否发生碰撞。在本发明中,选择拓扑地图,基于该拓扑地图,考量智能体的实际尺寸,新增异边同向冲突和异边异向冲突,能提高所规划路径的避碰安全性。

    一种人机协同自然语言空间导航方法及系统

    公开(公告)号:CN110928302A

    公开(公告)日:2020-03-27

    申请号:CN201911206721.7

    申请日:2019-11-29

    Abstract: 本发明公开一种人机协同自然语言空间导航方法及系统,机器人接收用户发送的空间导航语音指令,并根据预设的语法规则,将空间导航语音指令转化成相应的导航指令数组;空间导航语音指令属于自然语言;机器人采集机器人所在环境中界标物的位置和属性;并根据界标物的属性确定机器人的空间认知地图;机器人基于空间认知地图对导航指令数组进行认知推理,在空间认知地图中确定导航指令数组要求机器人所要到达的目的地的空间三维坐标,以及确定机器人到达目的地所要执行的动作;机器人根据目的地的空间三维坐标和所要执行的动作执行相关导航动作以到达目的地。本发明增强机器人对人类自然语言空间导航指令意图的理解。

    一种考虑点云骨架特征的未知物体六自由度抓取方法

    公开(公告)号:CN116460845A

    公开(公告)日:2023-07-21

    申请号:CN202310407270.3

    申请日:2023-04-13

    Abstract: 本发明公开了一种考虑点云骨架特征的未知物体六自由度抓取方法,采用基于L1中值骨架提取的迭代移动采样算法,保证抓取点最终均匀排布在物体的骨架上,避免生成大量无效抓取;利用骨架点的分布信息和骨架点周围点云的几何信息生成候选抓取位姿,有效提升了候选抓取姿态的质量;根据抓取器与物体之间的位置关系,使用启发式评价函数评估抓取位姿,从而保证位姿的最优化采样;适用于形状各异的未知物体,可以在非结构化环境下生成稳定的抓取位姿。

    考虑环境扰动和多目标约束的无人艇路径规划方法及系统

    公开(公告)号:CN116700269A

    公开(公告)日:2023-09-05

    申请号:CN202310749305.1

    申请日:2023-06-21

    Abstract: 本发明属于无人艇路径规划相关技术领域,其公开了一种考虑环境扰动和多目标约束的无人艇路径规划方法及系统,方法包括S1:构建包括洋流扰动、动态障碍物和目标点的海域环境信息;S2:采用深度强化学习算法中的Actor‑Critic框架,使得无人艇与所述海域环境信息进行交互,获得多个训练用数据四元组 ;S3:构建包括Actor网络、Value网络和Critic网络的深度学习网络架构,以所述四元组 中的局部环境信息s为输入a为输出,对所述Actor网络、Value网络和Critic网络进行训练;S4:采用训练好的深度学习网络架构对无人艇的路径进行规划。本申请解决了现有路径规划算法无法自主探索未知环境、鲁棒性差等缺陷。

    非线性系统滑模控制方法、装置、电子设备及存储介质

    公开(公告)号:CN116679560A

    公开(公告)日:2023-09-01

    申请号:CN202310642220.3

    申请日:2023-05-29

    Abstract: 本发明属于非线性系统控制相关技术领域,其公开了一种非线性系统滑模控制方法、装置、电子设备及存储介质,其中控制方法包括:建立非线性系统的包含参数不确定项以及外界扰动项的二阶动力学模型;设计扰动观测器估计集总扰动项的上界;根据扰动观测器的估计结果对集总扰动项进行补偿;建立模糊规则,进行滑模控制器的切换增益的自适应设计;构建李亚普诺夫函数,分析得到系统的自适应律。本发明基于滑模控制,引入参数摄动和外界环境的干扰进行动力学建模,通过引入扰动观测器对系统所受到的集总未知扰动进行估计,且结合模糊控制和滑模控制的优点,能够有效抑制外部扰动和未建模动态对于系统的影响,有利于实现对非线性系统的鲁棒稳定控制。

    一种基于序列预测与动态掩膜的机器人动态避障方法及系统

    公开(公告)号:CN119440002A

    公开(公告)日:2025-02-14

    申请号:CN202411539955.4

    申请日:2024-10-31

    Abstract: 本发明属于自主机器人轨迹规划与决策领域,并具体公开了一种基于序列预测与动态掩膜的机器人动态避障方法及系统,其包括:对动态避障问题本身进行MDP建模并搭建仿真环境;设计基于改进长短时记忆网络的传感器数据预测方法,通过对当前与过去一段时间的传感器数据输入,预测下一段时间的传感器数据;基于空间注意力网络设计传感器动态数据掩膜,并将掩膜数据与原始数据进行数据融合,对传感器数据进行扩充;设计策略函数和奖励函数,基于仿真环境对决策网络进行训练。通过强化学习算法的集成,能够不断优化避障策略,提高机器人在复杂环境中的导航和避障能力。

    一种基于体感技术的机车手信号操作训练方法

    公开(公告)号:CN107293175A

    公开(公告)日:2017-10-24

    申请号:CN201710662539.7

    申请日:2017-08-04

    Abstract: 本发明公开了一种基于体感技术的机车手信号操作训练方法,属于虚拟现实中的虚拟训练范畴。本发明为解决目前手信号教学训练中存在的无法实时地反馈训练结果及人工成本增加等不足。基于体感技术,通过数据采集并建立标准模板库,采用模板匹配算法对训练进行实时评估,建立一个互动性较好的手信号作业训练系统。该方法主要包含标准信号库的建立和信号实时的匹配训练两个部分。本发明在一定程度上为铁路手信号的培训提供一种有效的方法。

Patent Agency Ranking