-
公开(公告)号:CN119848158A
公开(公告)日:2025-04-18
申请号:CN202411665192.8
申请日:2024-11-20
Applicant: 深圳元戎启行科技有限公司 , 深圳大学 , 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请公开了语义地图的构建及自主移动设备的控制方法及相关装置。该方法包括:获取目标场景下具有深度信息的目标图像;利用标签提取网络、检测框提取网络和掩码提取网络获取目标图像中的物体掩码;从目标图像中提取出空间信息;融合物体掩码和空间信息形成语义点云;对语义点云进行降采样,并投影至网格地图中,形成语义地图。通过上述方式,构造出更准确更全面的语义地图,以此提高后续自动移动设备的导航定位准确性。
-
公开(公告)号:CN119453856A
公开(公告)日:2025-02-18
申请号:CN202411443394.8
申请日:2024-10-16
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请提供了一种清洁系统以及方法、装置。所述方法包括:获取来自终端设备的清洁请求信息,清洁请求信息包括待清洁目标的信息或所述待清洁目标的信息、目标位置;将清洁请求信息输入至已训练的大语言模型,获得已训练的大语言模型输出的清洁指令,清洁指令包括目标清洁设备的信息、清洁任务和任务位置的信息;根据目标清洁设备的信息,向目标清洁设备发送清洁指令。本申请利用已训练的大语言模型根据清洁需求生成清洁设备可识别的清洁指令,实现指示清洁设备执行指定任务,降低对人工的需求,以降低人工成本。
-
公开(公告)号:CN116844006A
公开(公告)日:2023-10-03
申请号:CN202310786578.3
申请日:2023-06-29
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请提供了一种目标识别方法、装置、电子设备及可读存储介质。所述方法包括:获取文本命令和待处理图像;提取文本命令中各待处理目标的文本向量;对待处理图像进行处理,获得各对象的图像向量,图像向量用于表征对象的图像信息;根据文本向量和图像向量,计算各待处理目标与各对象的相似度;选取目标相似度,目标相似度大于预设相似度;根据目标相似度,获得各待处理图像对应的图像向量。本申请通过相似度,查找到与文本命令中待处理目标对应的图像向量,以能在图像中识别对应待处理目标的对象,使得图中存在未知对象也能够识别。
-
公开(公告)号:CN116663606A
公开(公告)日:2023-08-29
申请号:CN202310553153.8
申请日:2023-05-16
Applicant: 人工智能与数字经济广东省实验室(深圳)
IPC: G06N3/0442 , G06N3/09 , G06N3/0985
Abstract: 本申请公开了一种多智能体参数共享方法及多智能体系统,属于人工智能技术领域。所述方法包括:对多个智能体的时变对比序列进行编码,确定多个智能体的第一抽象特征;利用图注意力机制网络对所述多个智能体的第一抽象特征进行连接组合,得到多个智能体的第二抽象特征;第二抽象特征相较于第一抽象特征为高层抽象特征;根据第一抽象特征为多个智能体分别选择匹配的第一Q网络;其中,所匹配的第一Q网络相同的智能体参数共享;根据第二抽象特征为多个智能体分别选择匹配的第二Q网络;其中,所匹配的第二Q网络相同的智能体参数共享。该方法能够提高多智能体的协作能力。
-
公开(公告)号:CN119623530A
公开(公告)日:2025-03-14
申请号:CN202411715522.X
申请日:2024-11-27
Applicant: 深圳大学 , 人工智能与数字经济广东省实验室(深圳) , 深圳元戎启行科技有限公司
Abstract: 本申请公开了一种信念生成模型的训练方法,应用于移动设备,包括:获取多个经验,其中每个经验包括经验数据集和所述经验数据集对应的经验优先级;基于所述多个经验的经验优先级,从所述多个经验中,确定目标经验;将所述目标经验输入到所述信念生成模型,以进行训练,得到所述信念生成模型,其中所述信念生成模型用于视频扩散任务的计算卸载与资源分配。本申请还公开了相关方法和设备。本申请提高了强化学习中的数据利用率。
-
公开(公告)号:CN117876925A
公开(公告)日:2024-04-12
申请号:CN202311802438.7
申请日:2023-12-25
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请提供了一种机器人打扫方法、装置、电子设备及可读存储介质。所述方法包括:接收来自机器人的第一环境信息后,将第一环境信息和演示视频信息输入至已训练的大语言模型,通过已训练的大语言模型基于演示视频信息根据第一环境信息确定动作信息,并向机器人发送动作信息,动作信息用于指示机器人根据动作信息打扫目标区域。本申请使得已训练的大语言模型能够根据第一环境信息和演示视频信息确定针对打扫房间的动作信息,以使机器人能够执行打扫任务,提高房间打扫效率,减少客人等待时间,以及减轻服务人员的负担。
-
公开(公告)号:CN117876808A
公开(公告)日:2024-04-12
申请号:CN202311670456.4
申请日:2023-12-06
Applicant: 人工智能与数字经济广东省实验室(深圳)
IPC: G06V10/774 , G06V10/40 , G06V10/74 , G06N3/006
Abstract: 本申请提供了一种模型训练方法及装置。所述方法包括:获取工作场景中不同视角的第一图像和第一点云,并提取各第一图像的第一语义信息;根据各第一图像和对应的第一语义信息,确定对应第一点云的第一点云特征信息;确定第一点云特征信息中各点的语义特征与目标物体的文本特征之间的相似度,获得第一相似度信息;利用第一点云、第一点云特征信息和第一相似度信息,训练动作预测模型,直至动作预测模型输出的针对指令的预测动作与专家动作之间的差异值小于预设阈值,获得已训练的动作预测模型。本申请提高模型的泛化能力,模型能够应用于不同的任务中。
-
公开(公告)号:CN116842384A
公开(公告)日:2023-10-03
申请号:CN202310798376.0
申请日:2023-06-29
Applicant: 人工智能与数字经济广东省实验室(深圳)
IPC: G06F18/214 , G06F18/21 , G06F18/25
Abstract: 本申请提供了一种多模态模型训练方法、装置、电子设备及可读存储介质。所述方法包括:将所述第一图像样本输入至图像处理模型,获得图像处理模型输出的第一图像信息;将第一指令输入至多模态模型,训练多模态模型,第一指令包括第一图像信息和对应的文本描述;在多模态模型中,根据文本描述确定第一文本信息;对齐第一图像信息和第一文本信息后,根据对齐后第一图像信息及第一文本信息确定对应第一图像样本的第一文本答案。本申请通过增加第一图像信息和第一文本信息,以使多模态模型基于对比学习将第一图像信息和第一文本信息对齐,提高了视觉信息与语言信息对齐的速度,使得多模态模型降低对庞大的模型容量及数据量的需求。
-
公开(公告)号:CN116793345A
公开(公告)日:2023-09-22
申请号:CN202310497766.4
申请日:2023-05-05
Applicant: 人工智能与数字经济广东省实验室(深圳)
Abstract: 本申请一种自移动设备的姿态估计方法、装置及可读存储介质。所述方法包括:获取自移动设备前进方向的第一深度图像;获取第一深度图像的特征点;确定第一深度图像的语义信息和第一动态目标的检测框;针对每个特征点,根据第一动态目标的检测框、语义信息和特征点的第一深度信息,确定特征点的动态概率,动态概率用于描述特征点位于动态目标的概率;去除目标特征点,目标特征点为动态概率大于预设概率值的特征点;根据剩余的特征点确定自移动设备的姿态。本申请能够准确去除动态目标的特征点,降低动态目标的特征点造成的影响,以能准确确定自移动设备的姿态,提高姿态估计的精度。
-
公开(公告)号:CN116580230A
公开(公告)日:2023-08-11
申请号:CN202310472332.9
申请日:2023-04-24
Applicant: 人工智能与数字经济广东省实验室(深圳) , 深圳市国电科技通信有限公司
IPC: G06V10/764 , G06V10/80 , G06V10/52 , G06V10/774 , G06V10/25
Abstract: 本申请涉及机器视觉技术领域,提供一种目标检测方法及一种分类模型的训练方法,一种目标检测方法包括获取待检测图像,并确定待检测图像中的感兴趣区域;将感兴趣区域分别输入至分类模型中的多个基学习器,利用多个基学习器分别输出与感兴趣区域对应的各候选标签的预测分类分数;各基学习器分别根据不同特征类型的样本特征训练得到;根据各预测分类分数从各候选标签中确定与感兴趣区域对应的分类标签;确定与感兴趣区域对应的位置信息;根据分类标签和位置信息输出待检测图像的检测结果。本方法能够利用各基学习器根据待检测图像的各特征精准确定出对应的预测分类分数,进而精准确定出分类标签,因此能够提高目标检测的精准度。
-
-
-
-
-
-
-
-
-