一种基于深度强化学习的移动机器人避障方法

    公开(公告)号:CN114237235B

    公开(公告)日:2024-01-19

    申请号:CN202111460950.9

    申请日:2021-12-02

    Abstract: 本发明公开了一种基于深度强化学习的移动机器人避障方法,通过激光雷达获取点云数据,对点云数据进行卷积特征提取,与行人位置、行人速度、全局路径共同作为神经网络输入,建立全连接神经网络,设定环境奖励,通过PPO深度强化学习算法输出机器人动作。相对于其他规划或学习的导航方法,本方法无需对行人进行预测、传感器预处理、简化了算法复杂度,更加适用于在多人环境下的机器人导航策略。同时由于加入全局路径作为输入量,提升了算法的适用范围,同时也加快了算法的收敛时间。

    一种基于循环神经网络的机械臂运动规划方法和系统

    公开(公告)号:CN117245668A

    公开(公告)日:2023-12-19

    申请号:CN202311448479.0

    申请日:2023-11-02

    Abstract: 一种基于循环神经网络的机械臂运动规划方法和系统,其方法包括:在机器人运行过程中获取基础环境点云,根据当前关节角度和目标关节角度计算得到的当前末端位置和目标末端位置在时间序列上调整基础环境点云,得到一系列带有时间序号的环境点云;建立循环神经网络模型,输出一系列带有时间序号的关节角度;从所述一系列带有时间序号的关节角度生成各个关节在机械臂基坐标系下的一系列带有时间序号的关节位置;计算规划误差;利用反向传播算法调整循环神经网络模型的权重,不断迭代降低规划误差,当规划误差低于设定阈值时迭代结束;循环神经网络模型的输出的带有时间序号关节角度即为机械臂的关节轨迹。本发明提升了机器人的运动规划能力。

    基于双向RGB-D特征融合的物体姿态估计方法及装置

    公开(公告)号:CN115578461A

    公开(公告)日:2023-01-06

    申请号:CN202211419607.4

    申请日:2022-11-14

    Abstract: 本发明公开了一种基于双向RGB‑D特征融合的物体姿态估计方法及装置,该方法的核心创新点为特征双向融合模块,通过将RGB与点云特征投影到标准空间以实现对齐,互补和相互增强的作用,提升了最终RGB‑D特征的显著性与代表性。此外,本发明还创新性地引入了感兴趣区域检测,特征恒等映射与残差融合,多任务协同训练,关键点投票与聚类,最小二乘法姿态解算等关键方法,极大改善了传统物体六自由度姿态估计中存在的抗干扰能力弱,精度不足等痛点问题。经多个实际场景测试,本发明可在杂乱环境下,高鲁棒性和高精度地实现对遮挡物体的六自由度姿态估计。

    一种独立关系检测的场景图生成方法和系统

    公开(公告)号:CN115512003A

    公开(公告)日:2022-12-23

    申请号:CN202211430055.7

    申请日:2022-11-16

    Abstract: 本发明属于计算机视觉领域,涉及一种独立关系检测的场景图生成方法和系统,该方法包括:步骤一,建立独立关系检测模型;步骤二,利用图像、图像对应的关系标签以及预定义方向锚训练所述独立关系检测模型,得到训练好的独立关系检测模型;步骤三,使用训练好的独立关系检测模型,输入图像和预定义方向锚,输出图像中存在的关系,对其中相似的关系采用相似关系抑制算法进行抑制;步骤四,同时将通过目标检测算法检测得到的物体包围框与所述输出图像中存在的关系的关系起始点和关系末端点进行位置匹配,得到 的三元组,构成场景图。本发明在不依靠目标检测结果的情况下就能对图像中的关系进行检测,提升了场景图生成的运算速度。

    注视目标估计的方法和装置、电子设备、神经网络结构

    公开(公告)号:CN112734820A

    公开(公告)日:2021-04-30

    申请号:CN202110331364.8

    申请日:2021-03-29

    Inventor: 於其之 金天磊

    Abstract: 本发明公开了一种注视目标估计的方法和装置、电子设备、神经网络结构,该方法包括:获取场景图像和场景图像中待处理人物的头部位置掩膜,从场景图像和头部位置掩膜提取场景特征和多层中间特征;将场景特征依次进行深度估计及多次上采样后与多层中间特征融合,获得深度辅助特征;根据头部位置掩膜从场景图像中获取头部图像,再从头部图像提取头部特征;根据头部特征计算视线辅助特征,将头部特征与视线辅助特征融合,获得视线特征;将场景特征与视线特征依次进行拼接、解码后与深度辅助特征融合,融合后进行特征转换输出注视目标位置。本发明提升了单目图像中人物的注视目标估计的准确率,适用于提高人机交互系统的意图识别能力。

    一种移动操作机器人的控制方法、装置和移动操作机器人

    公开(公告)号:CN117359633A

    公开(公告)日:2024-01-09

    申请号:CN202311459121.8

    申请日:2023-11-02

    Abstract: 本申请涉及一种移动操作机器人的控制方法、装置、计算机设备、存储介质和一种移动操作机器人。所述方法包括:获取移动操作机器人的目标位姿;将目标位姿输入至神经网络编码器中进行逆运动学求解处理,输出位移信息与关节角度信息;将位移信息和关节角度信息输入至正运动学解码器进行预测处理,输出预测位姿;根据目标位姿和预测位姿,对神经网络编码器进行迭代计算处理,得到目标位移信息和目标关节角度信息;基于目标位移信息和目标关节角度信息,控制移动操作机器人移动并调整至目标位姿。采用本方法能够同时计算机械臂关节角度和底盘相对移动距离,实现了远距离移动操作机器人的逆运动学求解,与更为精确的远距离移动操作机器人的控制。

    改进Transformer融入知识的端到端对话方法

    公开(公告)号:CN114625861B

    公开(公告)日:2022-09-06

    申请号:CN202210508811.7

    申请日:2022-05-11

    Abstract: 本发明公开了改进Transformer融入知识的端到端对话方法,首先收集以对话和知识组成的二元组,将该二元组作为训练数据;对训练数据进行清洗,将训练数据组成包括对话、知识和回复的三元组形式,并对该三元组进行预处理;构建由编码运算模块、知识解码器运算模块和解码器运算模块组成的改进的Transformer模型;利用训练数据与三元组训练改进的Transformer模型,并保存;将以对话和知识组成的二元组输入训练好的改进的Transformer模型中,模型预测输出回复结果;用户对模型输出的回复结果进行回复后,将模型输出的回复结果和用户回复拼接到对话记录串中,并选取新的知识输入训练好的改进的Transformer模型中持续进行端到端对话。该方法充分利用Transformer模型结构将知识细致融合用于生成对话。

    一种实时识别视频中说话人的方法及装置

    公开(公告)号:CN114819110A

    公开(公告)日:2022-07-29

    申请号:CN202210717252.0

    申请日:2022-06-23

    Abstract: 本发明公开了一种实时识别视频中说话人的方法及装置,该方法包括:获取同一时刻开始且连续的图像序列和音频序列;根据所述图像序列中最新一帧的图像,检测并跟踪人脸,更新已有的人脸序列信息库;将所述人脸序列信息库中的人脸序列信息和所述音频序列输入训练好的说话人检测网络中,检测说话状态,更新说话状态数据库;根据所述说话状态数据库,获取所有人的当前状态,从而识别视频中的可能的说话人。

    改进Transformer融入知识的端到端对话方法

    公开(公告)号:CN114625861A

    公开(公告)日:2022-06-14

    申请号:CN202210508811.7

    申请日:2022-05-11

    Abstract: 本发明公开了改进Transformer融入知识的端到端对话方法,首先收集以对话和知识组成的二元组,将该二元组作为训练数据;对训练数据进行清洗,将训练数据组成包括对话、知识和回复的三元组形式,并对该三元组进行预处理;构建由编码运算模块、知识解码器运算模块和解码器运算模块组成的改进的Transformer模型;利用训练数据与三元组训练改进的Transformer模型,并保存;将以对话和知识组成的二元组输入训练好的改进的Transformer模型中,模型预测输出回复结果;用户对模型输出的回复结果进行回复后,将模型输出的回复结果和用户回复拼接到对话记录串中,并选取新的知识输入训练好的改进的Transformer模型中持续进行端到端对话。该方法充分利用Transformer模型结构将知识细致融合用于生成对话。

    基于变分自编码器的融入知识和感情的端到端对话方法

    公开(公告)号:CN114610861A

    公开(公告)日:2022-06-10

    申请号:CN202210508804.7

    申请日:2022-05-11

    Abstract: 本发明公开了基于变分自编码器的融入知识和感情的端到端对话方法,所述方法包括:采集情感标签、对话、知识和回复,并进行预处理作为训练数据;搭建由变分自编码器模块和拷贝模块组成的模型,并进行训练;预处理测试数据,将测试数据输入训练好的模型中进行预测,得到回复,持续进行端到端对话。变分自编码器模块的编码模块编码情感标签和输入对话的语义信息。变分自编码器模块的解码模块融入知识和情感用于生成内容。拷贝模块结合解码器生成的内容、输入的对话和知识生成回复输出。本发明方法采用变分自编码器结构以生成丰富的回复;引入情感标签用于控制回复的情感类型;从输入对话和知识中拷贝信息,使生成回复兼具丰富性和可控性。

Patent Agency Ranking