-
公开(公告)号:CN114048284B
公开(公告)日:2025-05-23
申请号:CN202111136455.2
申请日:2021-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/334 , G06F16/58 , G06F16/583 , G06F40/289 , G06F40/30 , G06F18/25 , G06F18/22
Abstract: 本发明涉及指代表达定位与分割模型的构建方法和装置,包括:构建预处理图像主干网络、预处理文本主干网络、各个包含文本指导的视觉感知子网络和视觉指导的文本感知子网络的模态内在关系感知网络,各交叉模态融合网络、第一多尺度融合网络和第二多尺度融合网络,并利用指代表达定位与分割数据库对上述网络组合成的网络进行训练;本发明可以有效地进行图像与文本特征的学习,通过在语义、位置空间上建立的两模态的协同获取多尺度下图像‑文本协同特征,并对多尺度下图像‑文本协同特征进行融合及特征选择,进而使得模型能更准确、可靠地实现指代物的定位与分割。
-
公开(公告)号:CN119469131A
公开(公告)日:2025-02-18
申请号:CN202510031865.2
申请日:2025-01-09
Applicant: 中国科学院自动化研究所 , 北方工业大学
IPC: G01C21/16 , G01S17/86 , G01S17/894
Abstract: 本发明提供了一种基于多状态颜色一致性约束的定位方法、装置及设备,可以应用于计算机技术领域。该方法包括:基于定位点在三维点云中的三维位置,对定位点进行成像模拟,确定定位点在当前帧图像的成像位置;基于定位点在当前帧图像的投影位置和成像位置,对与当前帧图像对应的初始对象状态进行修正,得到修正对象状态,基于惯性测量工具的多个历史位姿、定位点的多个观测颜色、定位点在三维点云中的当前颜色以及颜色噪声分布参数,对修正对象状态进行修正,得到目标对象状态;基于目标对象状态,确定定位对象的目标位姿,以至少部分的解决相关技术中存在的定位效果不佳的技术问题,实现了提升定位鲁棒性和精度的技术效果。
-
公开(公告)号:CN115690839A
公开(公告)日:2023-02-03
申请号:CN202211305431.X
申请日:2022-10-24
Applicant: 中国科学院自动化研究所
IPC: G06V40/10 , G06V10/774
Abstract: 本发明提供一种行为决策方法、装置、电子设备及存储介质,其中方法包括:确定当前地图,以及前向轨迹模拟得到的各行为策略下未来预设连续多个时刻的行人轨迹和机器人轨迹;基于所述各行为策略下的行人轨迹和机器人轨迹,以及所述当前地图,确定所述各行为策略下的轨迹特征向量;基于评估代价函数,应用权重向量和所述各行为策略下的轨迹特征向量,对所述各行为策略进行评估,得到最优策略;所述权重向量是基于由样本行人轨迹和样本机器人示例轨迹组成的样本对训练得到的,实现了评估代价函数根据轨迹特征向量和权重向量进行策略评估的同时,避免了人工调整代价函数的特征权重,从而提升了复杂场景的适应能力。
-
公开(公告)号:CN115683122A
公开(公告)日:2023-02-03
申请号:CN202211313538.9
申请日:2022-10-25
Applicant: 中国科学院自动化研究所
IPC: G01C21/26
Abstract: 本发明提供一种以世界为中心的定位与全局地图优化方法、装置及设备,该方法包括:获取当前全局地图以及第一帧激光雷达数据与第二帧激光雷达数据对应时间段内的惯性测量装置IMU数据,第一帧激光雷达数据与第二帧激光雷达数据为相邻帧数据;根据IMU数据确定电子设备在世界坐标系下第二帧激光雷达数据对应的初始状态估计值;根据初始状态估计值确定世界坐标系下最终状态估计误差对应的等价先验分布,并根据第二激光雷达数据对应的第一特征点确定世界坐标系下的测量残差约束;根据等价先验分布及测量残差约束确定电子设备对应的当前位姿,并更新当前全局地图,得到目标全局地图。该方法可准确获得电子设备所在当前环境中的位姿及目标全局地图。
-
公开(公告)号:CN115455233A
公开(公告)日:2022-12-09
申请号:CN202210945260.0
申请日:2022-08-08
Applicant: 中国科学院自动化研究所
IPC: G06F16/74 , G06F16/78 , G06F16/783 , G06V10/80
Abstract: 本发明提供一种视频动态缩略图的生成方法、装置、设备和存储介质,应用于视频处理技术领域,该方法包括:获取查询文本,并提取所述查询文本的文本特征;基于所述查询文本,确定待处理视频;提取所述待处理视频的初始视频特征,并对所述初始视频特征进行划分,得到多个视频特征片段;基于所述多个视频特征片段和所述文本特征,生成所述待处理视频的视频动态缩略图。本发明能够实现生成基于用户检索意图的视频动态缩略图,提高了视频动态缩略图的准确性。
-
公开(公告)号:CN114048284A
公开(公告)日:2022-02-15
申请号:CN202111136455.2
申请日:2021-09-27
Applicant: 中国科学院自动化研究所
IPC: G06F16/33 , G06F16/58 , G06F16/583 , G06F40/289 , G06F40/30 , G06K9/62
Abstract: 本发明涉及指代表达定位与分割模型的构建方法和装置,包括:构建预处理图像主干网络、预处理文本主干网络、各个包含文本指导的视觉感知子网络和视觉指导的文本感知子网络的模态内在关系感知网络,各交叉模态融合网络、第一多尺度融合网络和第二多尺度融合网络,并利用指代表达定位与分割数据库对上述网络组合成的网络进行训练;本发明可以有效地进行图像与文本特征的学习,通过在语义、位置空间上建立的两模态的协同获取多尺度下图像‑文本协同特征,并对多尺度下图像‑文本协同特征进行融合及特征选择,进而使得模型能更准确、可靠地实现指代物的定位与分割。
-
公开(公告)号:CN106056079B
公开(公告)日:2019-07-05
申请号:CN201610375049.4
申请日:2016-05-31
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种图像采集设备及人脸五官遮挡检测方法,所述方法包括:步骤1:利用图像采集设备采集监控区域的视频图像;步骤2:对于所述图像采集设备采集得到的视频图像进行背景建模以及检测前景,并判断所述视频图像中有无人脸的出现;步骤3:当检测到所述视频图像中出现人脸时,检测所述图像采集设备是否出现遮挡,当判断出现遮挡时启动报警提示,当判断未出现遮挡时,转至步骤4;步骤4:继续进行人脸及五官的遮挡检测,即人脸完整性检测,并据此判断图像采集设备内是否存在人脸的遮挡。本发明方法实时性好,具有较高的检测准确率,为银行的自动柜员机系统提供了自动化、智能化的监控手段,为银行无人值班运行的管理模式提供技术支撑。
-
公开(公告)号:CN106056079A
公开(公告)日:2016-10-26
申请号:CN201610375049.4
申请日:2016-05-31
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00248 , G06K9/00281 , G06K9/6227 , G07F19/207
Abstract: 本发明公开了一种图像采集设备及人脸五官遮挡检测方法,所述方法包括:步骤1:利用图像采集设备采集监控区域的视频图像;步骤2:对于所述图像采集设备采集得到的视频图像进行背景建模以及检测前景,并判断所述视频图像中有无人脸的出现;步骤3:当检测到所述视频图像中出现人脸时,检测所述图像采集设备是否出现遮挡,当判断出现遮挡时启动报警提示,当判断未出现遮挡时,转至步骤4;步骤4:继续进行人脸及五官的遮挡检测,即人脸完整性检测,并据此判断图像采集设备内是否存在人脸的遮挡。本发明方法实时性好,具有较高的检测准确率,为银行的自动柜员机系统提供了自动化、智能化的监控手段,为银行无人值班运行的管理模式提供技术支撑。
-
-
-
-
-
-
-