-
公开(公告)号:CN114998904B
公开(公告)日:2024-08-27
申请号:CN202210655278.7
申请日:2022-06-10
Applicant: 燕山大学
IPC: G06V30/148 , G06V30/18 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/045
Abstract: 本发明涉及一种基于类编解码结构的草图语义分割方法,属于计算机视觉技术领域。具体地,将草图视为二维点集合,通过利用笔画内部结构和采样点的空间位置关系开发了新颖的局部特征聚集模块,该模块编码了丰富的局部特征,并定义了笔画距离,用于兼顾草图的二维空间分布和笔画结构;设计了线段层次自注意力模块用于建立和增强草图线段之间的关系,线段层次自注意力模块更好地描述了草图的内部结构;基于全局注意力机制,提出了末尾具有两个子分支的类编解码结构,包括:点层次子分支和线段层次子分支;最终,两个子分支的输出融合在一起生成语义分割结果。本发明相对于已存在的方法,具有更精准的分割结果和较高的鲁棒性。
-
公开(公告)号:CN113538402B
公开(公告)日:2022-06-07
申请号:CN202110865293.X
申请日:2021-07-29
Applicant: 燕山大学
Abstract: 本发明公开一种基于密度估计的人群计数方法及系统,涉及图像处理领域,方法包括:利用第一尺度感知金字塔注意力层对低层语义特征图提取尺度感知信息特征,得到低层多尺度语义特征图;利用第二尺度感知金字塔注意力层对中层语义特征图提取尺度感知信息特征,得到中层多尺度语义特征图;利用第三尺度感知金字塔注意力层对高层语义特征图提取尺度感知信息特征,得到高层多尺度语义特征图;利用特征融合层对低层多尺度语义特征图、中层多尺度语义特征图和高层多尺度语义特征图进行融合,得到多层次多尺度的融合特征图;利用人群密度图估计层对多层次多尺度的融合特征图进行人群密度估计,得到估计的人群密度图。本发明能快速准确得到人群计数结果。
-
公开(公告)号:CN114998904A
公开(公告)日:2022-09-02
申请号:CN202210655278.7
申请日:2022-06-10
Applicant: 燕山大学
Abstract: 本发明涉及一种基于类编解码结构的草图语义分割方法,属于计算机视觉技术领域。具体地,将草图视为二维点集合,通过利用笔画内部结构和采样点的空间位置关系开发了新颖的局部特征聚集模块,该模块编码了丰富的局部特征,并定义了笔画距离,用于兼顾草图的二维空间分布和笔画结构;设计了线段层次自注意力模块用于建立和增强草图线段之间的关系,线段层次自注意力模块更好地描述了草图的内部结构;基于全局注意力机制,提出了末尾具有两个子分支的类编解码结构,包括:点层次子分支和线段层次子分支;最终,两个子分支的输出融合在一起生成语义分割结果。本发明相对于已存在的方法,具有更精准的分割结果和较高的鲁棒性。
-
公开(公告)号:CN113538402A
公开(公告)日:2021-10-22
申请号:CN202110865293.X
申请日:2021-07-29
Applicant: 燕山大学
Abstract: 本发明公开一种复杂场景下结合跨模态信息的人群计数方法及系统,涉及计算机视觉技术领域,包括:获取待计数复杂场景下人群的RGB图像和深度图像;将RGB图像和深度图像输入优化后的深度神经网络模型中,得到估计的人群密度图;其中,深度神经网络模型包括依次连接的低层特征提取层、第一跨模态循环注意力融合层、中层特征提取层、第二跨模态循环注意力融合层、高层特征提取层、第三跨模态循环注意力融合层和人群密度图估计层;将估计的人群密度图进行逐像素相加,得到人群中人数的估计值。本发明能够避免现有人群计数方法在人群任意分布的复杂场景中准确率下降的问题。
-
公开(公告)号:CN115272957A
公开(公告)日:2022-11-01
申请号:CN202210805244.1
申请日:2022-07-08
Applicant: 燕山大学
Abstract: 本发明公开了一种基于特征交互的人群计数方法,属于图像处理技术领域,包括以下步骤:将原始图像输入深度神经网络模型中进行特征提取;将三层语义特征图送入语义交互结构;将融合后的三层语义特征图分别输入多尺度注意力模块;将高层语义特征图对应的尺度感知信息特征进行上采样和通道调整并与中层语义特征图对应的尺度感知信息特征进行融合;将融合后的特征进行上采样和通道调整并与低层语义特征图对应的尺度感知信息特征进行融合;将用于人群密度估计的主要特征图输入深度神经网络模型后端网络,得到人群密度估计图和人群计数结果。本发明能够有效提高人群密度估计的准确率。
-
公开(公告)号:CN113538400B
公开(公告)日:2022-08-26
申请号:CN202110865262.4
申请日:2021-07-29
Applicant: 燕山大学
Abstract: 本发明涉及一种跨模态人群计数方法及系统。所述方法包括:获取包括待计数人群的RGB图像和红外热图像;根据RGB图像得到RGB图像的跨模态人群分布信息注意力掩膜;分别对RGB图像和红外热图像进行特征提取操作得到RGB图像的特征表示和红外热图像的特征表示;根据跨模态人群分布信息注意力掩膜和RGB图像的特征表示得到RGB图像特征图;根据RGB图像特征图和红外热图像的特征表示得到特征图;对特征图进行卷积操作得到人群密度估计图;根据人群密度估计图得到待计数人群的总人数。本发明可以提高人群计数的准确率。
-
公开(公告)号:CN113538400A
公开(公告)日:2021-10-22
申请号:CN202110865262.4
申请日:2021-07-29
Applicant: 燕山大学
Abstract: 本发明涉及一种跨模态人群计数方法及系统。所述方法包括:获取包括待计数人群的RGB图像和红外热图像;根据RGB图像得到RGB图像的跨模态人群分布信息注意力掩膜;分别对RGB图像和红外热图像进行特征提取操作得到RGB图像的特征表示和红外热图像的特征表示;根据跨模态人群分布信息注意力掩膜和RGB图像的特征表示得到RGB图像特征图;根据RGB图像特征图和红外热图像的特征表示得到特征图;对特征图进行卷积操作得到人群密度估计图;根据人群密度估计图得到待计数人群的总人数。本发明可以提高人群计数的准确率。
-
-
-
-
-
-