-
公开(公告)号:CN117132954A
公开(公告)日:2023-11-28
申请号:CN202311096618.8
申请日:2023-08-28
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V20/56 , G06V20/70 , G06V10/26 , G06V10/764 , G06V10/84
Abstract: 本发明公开了一种基于语义栅格地图的机器人场景识别方法、系统、存储介质及终端,属于室内移动机器人场景识别技术领域,包括:获取语义栅格地图,并根据语义栅格地图得到封闭的轮廓图;对封闭的轮廓图进行区域分割与语义物体类别提取,得到子区域以及语义物体;计算当前子区域为特定家居场景的概率值,并根据所述概率值识别子区域所在场景。本发明基于语义栅格地图的场景识别方法不受限于模型以及算力,可以实现扫地机器人快速准确地识别出场景,更好地完成与场景有关的指令任务。
-
公开(公告)号:CN116630754A
公开(公告)日:2023-08-22
申请号:CN202310360864.3
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
IPC: G06V10/80 , G06V10/764 , G06V10/40 , G06N3/0464 , G06N3/08
Abstract: 本申请提供显著区域推断方法和系统,涉及目标检测的技术领域。在该方法中,服务器获取待检测图片的基础特征图;服务器根据多尺度通道注意力机制,对所述基础特征图进行多尺度特征提取,得到多尺度特征图;服务器将所述多尺度特征图输入至自适应特征融合网络中,得到所述待检测图片的显著区域,以完成对所述待检测图片的显著区域推断。实施本申请提供的技术方案,具有提高图片显著区域的推断准确性的效果。
-
公开(公告)号:CN116363579A
公开(公告)日:2023-06-30
申请号:CN202310211972.4
申请日:2023-03-07
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
Abstract: 本发明公开了一种重识别辅助的多阶段视频行人多目标跟踪方法及模型,搭建包括作为骨干网络的ResNet50、多层特征聚合模块、包括一个上下文抓取模块和一个注意力引导模块的注意力引导的上下文聚合模块、IDAUP子模块的MSMOT模型,并用其检测得到行人的检测边界框,并提取行人的重识别特征;注意力引导模块包括上下文注意力模块和内容注意力模块,IDAUP子模块输出浅层特征信息和深层特征信息分别作为重识别分支和检测分支的输入,检测分支采用三个并行的Head分别用于估计HeatMap、中心点的偏移以及边界框的尺寸;通过以卡尔曼滤波和匈牙利算法为基础的数据关联算法,依托检测边界框与重识别特征,完成检测边界框与相对应的行人轨迹之间的匹配。
-
公开(公告)号:CN119323802A
公开(公告)日:2025-01-17
申请号:CN202411438787.X
申请日:2024-10-15
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V40/10 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82 , G06V10/86 , G06N3/042 , G06N3/045 , G06N3/0464
Abstract: 本发明公开了基于异构图语义区分的行人再识别方法、计算机程序产品及终端,属于图像处理技术领域,包括以下步骤:以特征块作为节点分支、节点之间的边缘关系作为边缘分支建立异构图,并将相同或相似分类标签的节点进行聚合,以反映语义关联;根据相邻节点的特征表示进行聚合处理,并根据亲和属性值筛选语义更接近的节点对;根据相关性对节点特征进行聚合处理,得到跨时空的聚合特征;根据跨时空的聚合特征执行Re‑ID任务。本发明对节点之间的语义相关性进行度量,成功区分出了噪声、非目标语义和目标语义,在不牺牲有效信息的前提下,最大限度地聚合目标语义,保证语义区分和信息保留的可行性,增强对遮挡目标的语义感知能力。
-
公开(公告)号:CN117132636A
公开(公告)日:2023-11-28
申请号:CN202311086575.5
申请日:2023-08-25
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06T7/55 , G06T7/80 , G06T7/73 , G06N3/0464 , G06N3/048 , G06N3/08 , G01S11/12 , G01B11/26 , G01B11/14
Abstract: 本发明公开了基于深度学习和模板匹配的双目摄像头测距方法及终端,属于扫地机器人技术领域,包括:将双目摄像头采集的对应两幅图像进行极线约束处理;对其中一摄像头采集的图像进行目标检测处理,得到目标框,并作为模板;以另一摄像头采集的图像为目标图,基于目标框位置范围在目标图中水平搜索模板,得到模板在目标图的位置,并计算视差;将视差转为三维坐标,得到目标物体的距离信息、角度信息。基于极线约束的作用,对模板的搜索范围能够被限制在同一极线上,使搜索范围由全局变为局部,大大提高了图像处理速度,能够满足实时性检测要求;模板匹配过程中考虑的是物体整体信息,能有效避免缺失特征点的问题,不会出现漏检的问题。
-
公开(公告)号:CN117132620A
公开(公告)日:2023-11-28
申请号:CN202311089704.6
申请日:2023-08-28
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06T7/246
Abstract: 本发明公开了一种自动驾驶场景的多目标跟踪方法、系统、存储介质及终端,属于自动驾驶领域,包括:对每一帧输入图像进行三维目标检测;将当前的所有三维目标框投影至鸟瞰图,得到检测框;判断历史生成的物体对象是否在视野范围内,将在视野范围内的物体投影至鸟瞰图,得到目标框;计算所述检测框与目标框的交并比;根据所述交并比的计算结果判断物体是否被成功跟踪;剔除被成功跟踪的动态物体内的特征点。本发明将三维目标检测结果投影至鸟瞰图中,建立当前检测物体与历史生成物体的匹配关系,并根据该匹配关系跟踪多目标,同时剔除动态框内特征点,不受动态物体的的干扰,估计准确。
-
公开(公告)号:CN117115493A
公开(公告)日:2023-11-24
申请号:CN202311086436.2
申请日:2023-08-25
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G06V10/762 , G06V10/25 , G06V10/82 , G06V10/74 , G01S17/894 , G01C21/32
Abstract: 本发明公开了一种基于聚类的语义雷达生成及建图方法,包括以下步骤:获取输入数据;聚类与目标检测;将雷达簇和检测框进行匹配;优化匹配结果;语义雷达生成;双路雷达生成。本发明根据距离聚类,能有效将雷达点根据距离分成不同的类别,实时性高,为后续区分物体和背景做好基础;同时,根据每一簇雷达点与目标框的比例信息能够有效给雷达点赋上语义信息,再根据每一簇落入检测框的雷达计算其相对于框内所有雷达点数量的比例来区分该簇雷达点是物体还是背景;另外,带语义信息的雷达点,只有在视觉范围内观测到了才会做更新避免刚建完的语义物体随着机器人的移动而消失的问题。
-
公开(公告)号:CN116909292A
公开(公告)日:2023-10-20
申请号:CN202311089826.5
申请日:2023-08-28
Applicant: 电子科技大学 , 喀什地区电子信息产业技术研究院
IPC: G05D1/02
Abstract: 本发明公开了一种基于伪激光雷达与激光雷达融合的机器人避障方法、系统、存储介质及终端,用于生成包含盲区小物体的栅格地图,属于扫地机器人技术领域,包括:分别获取激光雷达数据和伪激光雷达数据;通过联合标定的方式将所述伪激光雷达数据转为雷达坐标系下的数据;根据伪激光雷达数据修改相应范围内的激光雷达数据,得到融合数据;根据所述融合数据还原盲区小物体的信息并建立栅格地图。本发明利用融合数据,将小物体绘制在栅格地图上,可以仅利用栅格地图即可完成路径规划,且机器人离开当前区域后,栅格地图仍能保持小物体的栅格点,可以实现全局的路径规划,实现激光雷达盲区的矮小物体避障功能。
-
公开(公告)号:CN116630841A
公开(公告)日:2023-08-22
申请号:CN202310366264.8
申请日:2023-04-06
Applicant: 喀什地区电子信息产业技术研究院
Abstract: 一种基于注意力的目标检测方法和系统,涉及行人身份识别领域领域。在该方法中,包括以下步骤:获取待检测视频;通过第一特征网络对待检测视频包含的待检测视频帧进行处理,生成待检测视频的特征表示,所述第一特征网络包括简化ResNet底部网络以及空间金字塔顶部网络,简化ResNet底部网络用于提取待检测视频帧的多维视频帧特征,空间金字塔顶部网络用于对待检测视频帧的多维视频帧特征进行融合处理,生成所述待检测视频帧的特征表示;根据全部待检测视频帧的特征表示,在待检测视频中生成目标检测结果。通过采用本申请提供的技术方案,简化第一特征网络的结构,减少第一特征网络的参数数量,从而提升行人检测方法的检测速度。
-
-
-
-
-
-
-
-