一种多智能体强化学习方法、装置及介质

    公开(公告)号:CN116560239B

    公开(公告)日:2023-09-12

    申请号:CN202310824569.9

    申请日:2023-07-06

    Abstract: 本发明公开了一种多智能体强化学习方法、装置及介质,属于多个智能体行为自主控制技术领域。其中方法包括:获取观测,智能体根据观测获取动作概率分布,以及推理队友智能体基于观测的动作概率分布;根据获得的动作概率分布,计算每个智能体与队友智能体的行为一致性;通过动态缩放网络获取动态调节因子,根据动态调节因子计算行为一致性的内部奖励;根据链式求导法则,以最大化外部回报为目标,对动态缩放网络的参数进行优化;使用优化完成的策略实现多智能体的协作任务。本发明提出一种基于行为一致性的内在奖励,解决多智能体协作算法忽略智能体之间行为意图的配合,从而导致出现次优化策略的问题,能够有效地提高多智能体之间的协作性能。

    一种基于开放场景地图的视觉语言导航方法、装置及介质

    公开(公告)号:CN116499471B

    公开(公告)日:2023-09-12

    申请号:CN202310788171.4

    申请日:2023-06-30

    Abstract: 本发明公开了一种基于开放场景地图的视觉语言导航方法、装置及介质,属于智能导航技术领域。其中方法包括:获取智能体在环境中的视觉图像数据;根据视觉图像数据构建开放场景地图表征,所述开放场景地图表征包括物体属性层级地图、开放场景物体语义地图和标志物语义层级地图;根据构建的开放场景地图表征预测子目标点的位置及导航进度,并执行对应动作。本发明将物体属性层级信息结合开放场景物体和指令标志物的语义信息,将以上信息结合构建开放场景地图,提升该地图对开放场景中多样化物体的属性、位置的表征能力,使地图表征不局限于固定的少量物体类别,且增加的物体属性信息可帮助智能体消除物体类别歧义,准确定位感兴趣物体。

    一种视觉语言导航方法、系统、装置及存储介质

    公开(公告)号:CN116576861A

    公开(公告)日:2023-08-11

    申请号:CN202310561684.1

    申请日:2023-05-17

    Abstract: 本发明公开了一种视觉语言导航方法、系统、装置及存储介质,其中方法包括:获取智能体在环境中的视觉图像数据;所述视觉图像数据包括RGB图像和深度图像;根据视觉图像数据构建地图表征,以及提取指令标志物;根据地图表征和指令标志物,执行弱监督指令标志物定位任务,构建指令标志物地图;预测子目标点位置及导航进度,并执行对应动作。本发明通过建立指令中相关物体与语义地图的对应关系,从而提升指令特征和地图特征的表征能力,实现两种模态的对齐和融合。本发明可广泛应用于智能导航技术领域。

    一种基于多尺度图像和加权融合损失的小目标检测方法

    公开(公告)号:CN111461110B

    公开(公告)日:2023-04-28

    申请号:CN202010134062.7

    申请日:2020-03-02

    Inventor: 林坤阳 罗家祥

    Abstract: 本发明属于图像、视频处理领域,涉及一种基于多尺度图像和加权融合损失的小目标检测方法,包括:基于改进Mask RCNN模型对多种不同尺度图像提取多组特征向量,对多组特征向量进行融合,构造特征金字塔;基于特征金字塔生成候选检测框并筛选得到建议检测框;将建议检测框对应回特征金字塔中产生它们的特征图中,在特征图上对齐截取;将对齐后的建议检测框输入分类器层,得到建议检测框的类别置信度和位置偏移量;在测试阶段,根据建议检测框的类别置信度得分大小筛选一定的建议检测框,并做非极大值抑制;在训练阶段,对检测小目标特征层计算出的损失函数进行加权,并与检测大、中目标层的损失函数融合,增强模型对小目标物体的敏感程度。

    一种基于多尺度图像和加权融合损失的小目标检测方法

    公开(公告)号:CN111461110A

    公开(公告)日:2020-07-28

    申请号:CN202010134062.7

    申请日:2020-03-02

    Inventor: 林坤阳 罗家祥

    Abstract: 本发明属于图像、视频处理领域,涉及一种基于多尺度图像和加权融合损失的小目标检测方法,包括:基于改进Mask RCNN模型对多种不同尺度图像提取多组特征向量,对多组特征向量进行融合,构造特征金字塔;基于特征金字塔生成候选检测框并筛选得到建议检测框;将建议检测框对应回特征金字塔中产生它们的特征图中,在特征图上对齐截取;将对齐后的建议检测框输入分类器层,得到建议检测框的类别置信度和位置偏移量;在测试阶段,根据建议检测框的类别置信度得分大小筛选一定的建议检测框,并做非极大值抑制;在训练阶段,对检测小目标特征层计算出的损失函数进行加权,并与检测大、中目标层的损失函数融合,增强模型对小目标物体的敏感程度。

    一种交互式导盲系统
    16.
    实用新型

    公开(公告)号:CN211512572U

    公开(公告)日:2020-09-18

    申请号:CN201921601724.6

    申请日:2019-09-25

    Abstract: 本实用新型属于导盲系统技术领域,涉及一种交互式导盲系统。交互式导盲系统包括中央处理器及与其相连的深度相机、高端语音合成装置、麦克风和电源,其中:中央处理器:用于系统控制、目标检测、路径规划、语音识别和信号传递;深度相机:用于对当前场景进行图像采集,生成RGB图像与深度图;高端语音合成装置:用于对所述中央处理器输出的语音信息进行合成,播放寻物结果或道路规划情况;麦克风:用于采集用户语音信息,并传送给中央处理器;电源:用于给所述中央处理器供电。本实用新型能辅助盲人更好地生活,提高盲人的生活质量。(ESM)同样的发明创造已同日申请发明专利

Patent Agency Ranking