-
公开(公告)号:CN111698386A
公开(公告)日:2020-09-22
申请号:CN202010455596.X
申请日:2020-05-26
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: H04N5/04
Abstract: 本发明涉及一种多路图像数据前端同步发送装置,包括:图像接入与合并传输模块,用于完成多路图像数据的同步接入与合并;图像帧编号添加模块,用于对合并后的图像数据依次添加图像帧编号;图像行/帧校验添加模块,用于对图像数据添加行/帧校验码;至少两条图像发送通道,用于完成多路图像的同步输出,其中,每条图像发送通道中传输的图像数据完全相同。本发明还涉及一种多路图像数据后端同步接收装置和一种多路图像数据的远距离同步传输系统。本发明对非压缩的多路图像数据能够提高同步传输可靠性。
-
公开(公告)号:CN111190981A
公开(公告)日:2020-05-22
申请号:CN201911354167.7
申请日:2019-12-25
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本申请涉及一种三维语义地图的构建方法、装置、电子设备及存储介质,该方法通过获取环境图像集合,并根据已训练的语义分割模型对环境图像集合进行语义分割,得到语义图像序列。将语义图像序列的每帧语义图像投射到预先建立的三维坐标系上,得到第一点云集合,第一点云集合中的第一点云对应每帧语义图像。对第一点云集合进行滤波,得到滤波后的第一点云集合;对滤波后的第一点云集合中的第一点云进行聚类处理,得到第二点云集合;对第二点云集合进行滤波,得到三维语义地图。本申请将彩色图像序列和深度图像序列结合作为语义分割模型的输入,如此,可以提升语义预测能力,且基于带语义的点云分层次地进行滤波,可以节约缓存、提升实时性。
-
公开(公告)号:CN119918598A
公开(公告)日:2025-05-02
申请号:CN202411933694.4
申请日:2024-12-26
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06N3/063 , G06N3/0455 , G06N3/0464 , G06V10/44 , G06V10/46 , G06V10/82 , G06V10/94 , G06F15/78
Abstract: 本发明涉及一种基于数据流驱动的片上卷积神经网络计算系统,包括:卷积神经网络模块,用于对输入图像进行特征提取并生成第一特征张量和第二特征张量;所述卷积神经网络模块包括由若干卷积层构成的共享编码器、特征点解码器和描述子解码器,各个卷积层之间采用流接口进行数据传递,并基于缓存机制实现由数据流驱动的卷积层数据处理;特征点提取模块,用于基于所述第一特征张量提取特征点坐标,并实时输出所述特征点坐标和扫描坐标;描述子计算模块,用于实时获取所述特征点坐标、所述扫描坐标,并根据所述特征点坐标和所述扫描坐标从所述第二特征张量中选择对应位置的张量数据进行描述子计算。本发明能够有效实现并加速片上卷积神经网络计算。
-
公开(公告)号:CN119888250A
公开(公告)日:2025-04-25
申请号:CN202411912298.3
申请日:2024-12-24
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种基于归一化交并比的目标关联方法,包括以下步骤:获取源目标集;对待处理图像进行目标检测,获得若干候选边界框及其置信度;提取置信度高于设定的置信度阈值的所述候选边界框,组成候选目标集;以源目标集中各个待关联目标对应的边界框与各个所述获选边界框的归一化交并比值为元素构建代价矩阵,所述归一化交并比值#imgabs0#基于所述代价矩阵,利用匈牙利算法求解与所述待关联目标最匹配的所述获选边界框,获得多个最佳匹配对;根据每组所述最佳匹配对的归一化交并比值确定目标是否关联。本发明能够显著提升目标追踪关联任务的准确度。
-
公开(公告)号:CN119832176A
公开(公告)日:2025-04-15
申请号:CN202411879409.5
申请日:2024-12-19
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06T17/05 , G06T7/55 , G06T7/70 , G06V10/25 , G06V10/774 , G06V10/82 , G06N3/0464 , G06V10/26 , G01C22/00
Abstract: 本发明涉及一种基于多目视觉场景理解的无人系统自主探索方法,该方法融合可见光和红外图像优势,提高了无人系统在恶劣天气、光照变化及通信受限场景下的适应能力。通过多模态图像融合、轻量级目标检测和基于深度阈值的背景滤除实现类像素级的语义分割,精确估算感兴趣目标位姿。利用体素地图和目标检测结果构建探索边界,并基于此实现兼顾探索空间和场景理解的探索决策,引导无人系统执行自主探索任务。本发明为复杂任务场景下的视觉定位与场景感知提供了有力支撑,显著提升无人系统的鲁棒性与环境适应能力,适用于野外救援、隧道巡检及矿洞勘察等复杂任务场景。
-
公开(公告)号:CN119567244A
公开(公告)日:2025-03-07
申请号:CN202411526399.7
申请日:2024-10-30
Applicant: 中国科学院上海微系统与信息技术研究所
Abstract: 本发明涉及一种模拟眼球交互式视线的生成方法及装置。其中,生成方法包括以下步骤:通过位置传感器获取交互目标的位置,得到交互目标在第一坐标系的坐标Po;根据位置传感器与模拟眼球的位置关系推导第一坐标系与第二坐标系的坐标转换关系,进而基于所述左边转换关系将坐标Po转换为交互目标在第二坐标系的坐标P1;获取各个模拟眼球的视点在第二坐标系的坐标Oi,其中i代表模拟眼球的序号;根据坐标Oi和坐标P1计算获得各个模拟眼球的交互式视线朝向Di。本发明能够准确获得目标与眼球的相对位置并生成交互式视线,使模拟眼球在交互时更加自然。
-
公开(公告)号:CN116309698B
公开(公告)日:2024-06-11
申请号:CN202310038906.1
申请日:2023-01-11
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06T7/246 , G06T5/00 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 本发明涉及一种基于运动特征弥补引导的多帧光流估计方法,包括以下步骤:提取至少连续两帧的输入图像的图像特征;基于相邻两帧的输入图像的图像特征,采用运动编码器得到初始运动特征;将初始运动特征和历史集成特征输入至MFC单元,所述MFC单元通过交叉注意力得到增强运动特征,并与初始运动特征合并得到集成特征;将所述集成特征输入至迭代模块进行迭代计算,得到最终光流。本发明可以大大改进光流估计在遮挡区域的性能。
-
公开(公告)号:CN118038133A
公开(公告)日:2024-05-14
申请号:CN202410067260.4
申请日:2024-01-17
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/764 , G06V10/40 , G06V10/774 , G06V10/80 , G06N3/0464
Abstract: 本发明涉及一种基于多层级分类分支的目标检测方法及系统。其中的目标检测方法包括以下步骤:获取待测样本;利用基于多层级分类分支的目标检测模型对所述待测样本进行检测,获得目标检测结果;所述基于多层级分类分支的目标检测模型包括:特征提取模块,用来提取所述待测样本的特征向量;特征融合模块,用来对所述特征向量进行特征融合获得融合特征向量;预测模块,用来根据所述融合特征向量生成目标检测框和与所述目标检测框对应的多个层级的分类结果,并将所述多个层级的分类结果进行融合计算得到最终分类结果。在现有深度学习的目标检测网络的基础上,通过增加多层级分类分支预测结果的融合计算,有效提升其分类及识别能力。
-
公开(公告)号:CN112966584B
公开(公告)日:2024-04-19
申请号:CN202110223264.3
申请日:2021-02-26
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V10/82 , G06V10/44 , G06V10/774 , G06V40/20 , G06T7/269 , G06N3/0464 , G06N3/09
Abstract: 本发明涉及一种运动感知模型的训练方法、装置、电子设备及存储介质,包括获取训练图像组集合和每一训练图像组对应的标签光流信息,对每一训练图像组进行特征提取处理,确定多个目标特征图集,从每一目标特征图集中,确定每一训练图像组对应的预测光流信息,根据标签光流信息和预测光流信息,确定每一目标特征图集对应的损失信息,基于每一目标特征图集对应的损失信息对当前机器学习模型的参数进行调整,当对当前机器学习模型的参数进行调整的次数大于预设阈值时,将当前机器学习模型确定为运动感知模型,将损失信息对应的模型参数确定为运动感知模型的参数。本申请可以监督中间的特征层的采样所得到感知信息,提高模型输出的运动状态的精确性。
-
公开(公告)号:CN117636282A
公开(公告)日:2024-03-01
申请号:CN202311620329.3
申请日:2023-11-30
Applicant: 中国科学院上海微系统与信息技术研究所
IPC: G06V20/56 , G06V10/80 , G06V10/764 , G06V10/40 , G06V10/774 , G06V10/776 , G06V10/82
Abstract: 本发明涉及一种基于多重约束的栅格占据率估计方法、设备及介质,方法包括:接收车辆周围相机传感器获取的多视角相机图像;将多视角相机图像输入至栅格占据率估计模型中,得到栅格占据率预测结果;其中,栅格占据率估计模型增加了对每个视角的二维重投影监督,能够有效约束对侧不同物体的特征,还设计了基于物体一致性的空间约束,利用周围体素对处理后的当前体素进行语义标注的影响,解决预测三维结果中的异常值问题。本发明能有效提高算法精度及运算速度,提高了栅格占据率的估计效果。
-
-
-
-
-
-
-
-
-