-
公开(公告)号:CN108520250B
公开(公告)日:2021-09-14
申请号:CN201810352496.7
申请日:2018-04-19
Applicant: 北京工业大学
Abstract: 本发明公开一种人体运动序列关键帧提取的方法,对给定的人体运动序列,首先计算每一帧各关节点与其它关节点的位置偏移矢量作为相应关节点的特征,然后,根据人体运动先验知识以关节点组合的形式定义关节点团,由关节点团的特征组合实现运动帧的特征表示,同时定义基于关节点团特征表示的人体运动帧间相似度度量模型;最后,在此模型基础上使用仿射传播的聚类算法实现数据自适应的人体运动序列关键帧提取。
-
公开(公告)号:CN113283282A
公开(公告)日:2021-08-20
申请号:CN202110262515.9
申请日:2021-03-10
Applicant: 北京工业大学
Abstract: 一种基于时域语义特征的弱监督时序动作检测方法属于计算机视觉视频领域,弱监督时序动作检测任务是在仅依靠视频级别标签的情况下,对未修剪的长视频中的每一段动作进行时序上的定位和分类。目前的方法还是将时序动作检测任务视为动作识别的变体任务,他们着重在模型的特征提取、提名生成、分类器训练等方面做研究,却忽视了该任务视频本身的时域语义特征。本发明首先归纳了长视频时域语义特征:动作片段在时序上的稀疏性、相邻片段之间的语义特征具有相似性而距离较远的片段间语义特征具有差异性等,并基于此设计一种新的网络模型来提升视频分类和时序定位的精度。本发明性能超过了目前的先进方法。
-
公开(公告)号:CN113239824A
公开(公告)日:2021-08-10
申请号:CN202110544122.7
申请日:2021-05-19
Applicant: 北京工业大学
Abstract: 本发明涉及一种基于3D‑Ghost模块的多模态训练单模态测试的动态手势识别方法,用于解决多模态训练单模态测试的动态手势识别问题,具体利用RGB数据和深度数据训练整体网络,整体网络采用并行双通道协作学习的结构,旨在通过不同模态网络之间传递知识来改善学习过程,通道m用于通过RGB数据识别动态手势,通道n用于通过深度数据识别动态手势;训练完成后,将RGB数据输入通道m进行动态手势识别,或者将深度数据输入通道n进行动态手势识别;其中通道采用I3D网络并对其进行改进,改进之处在于增加了注意力模块,部分3D卷积层替换为3D‑Ghost模块,对所有Inception‑V1子模块进行改进。
-
公开(公告)号:CN108470209B
公开(公告)日:2021-06-04
申请号:CN201810258375.6
申请日:2018-03-27
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于格拉姆矩阵正则化的卷积神经网可视化方法,包括给定一个图像表示函数和参考表示,通过优化目标函数求出这个参考表示的输入层数据,作为对应的卷积神经网络待可视化层的可视化结果。本发明可以对不同的卷积神经网络的不同层的特征进行可视化。本发明对可视化技术的正则项进行了改进,取得了对可视化的愚弄效应进行抵抗的效果。
-
公开(公告)号:CN112634438A
公开(公告)日:2021-04-09
申请号:CN202011555713.6
申请日:2020-12-24
Applicant: 北京工业大学
Abstract: 基于对抗网络的单帧深度图像三维模型重建方法及装置,不需要人工设计复杂的特征算法,避免了复杂的相机校准及精细的流程设计,并具备了重建对象被遮挡区域的能力,不仅提高了重建精度,而且能够在提升对象细节质量的同时,抑制冗余形状的增生。方法包括:(1)在生成器部分,利用胶囊编码器将输入的单帧深度图像编码为多个潜在胶囊,然后利用注意力解码器将这些潜在胶囊解码并融合生成一个3D初始形状;(2)在判别器部分,通过与生成器的整体对抗学习,优化所述3D初始形状;(3)在优化器部分,对所述3D初始形状进行局部结构优化,生成3D细化形状。
-
公开(公告)号:CN109584557B
公开(公告)日:2021-02-26
申请号:CN201811536443.7
申请日:2018-12-14
Applicant: 北京工业大学
Abstract: 本发明公开了一种基于动态分解模式和矩阵填充的交通流预测方法,本方法从设置在道路上的各种交通探测器中得到的交通数据,将其处理成m‑1列的数据快照矩阵的形式,然后分成两个快照矩阵来分别代表原始数据的前m列和后m列。之后利用低秩矩阵填充中的映射算子方法生成对应于每一个数据快照矩阵的映射矩阵P,然后将映射矩阵与对应的数据快照矩阵进行点乘操作,最后通过基于动态模式分解方法的模型进行交通预测得到待估计的交通量。在动态模式分解进行交通流预测的模型基础上,考虑了由于外界天气或交通设备自身会发生失灵等问题,会造成交通数据发生丢失的问题。
-
公开(公告)号:CN112365581A
公开(公告)日:2021-02-12
申请号:CN202011281969.2
申请日:2020-11-17
Applicant: 北京工业大学
IPC: G06T17/00
Abstract: 一种基于RGB数据的单视角和多视角三维重建方法及装置,能够充分利用输入图像的个性特征和其属于特定类别的共性特征,以及物体自身的几何信息来增强三维重建效果,能够获得高精度的三维重建结果。方法包括:(1)融合输入视角的个性化特征和其所属类别的共性化特征,重建得到初始化的三维体素;(2)在初始化的三维体素基础上,利用体素在特定视角下的先验对称性和本身具有的内部上下文依赖关系指导体素注意力图结构的构建,基于体素注意力图结构,利用多尺度图卷积对初始体素进行细化处理。
-
公开(公告)号:CN112232106A
公开(公告)日:2021-01-15
申请号:CN202010807901.7
申请日:2020-08-12
Applicant: 北京工业大学
Abstract: 一种二维到三维人体姿态估计方法,其能够克服三维标注数据的不足以及背景、灯光、服装形状和纹理、肤色等条件的影响,并从多尺度中提取特征,促进不同姿态之间的相互学习,得到更加准确的三维姿态。该方法包括:(1)分层图卷积网络;(2)结合对角占优图卷积层和非局部层的特征提取网络块;(3)人体几何约束。
-
公开(公告)号:CN109741358B
公开(公告)日:2020-11-06
申请号:CN201811634332.X
申请日:2018-12-29
Applicant: 北京工业大学
IPC: G06T7/155
Abstract: 本发明涉及一种基于自适应超图学习的超像素分割方法,属于计算机视觉领域中的图像分割技术,包括以下步骤:步骤一:图像预处理,即对输入的RGB图像进行下采样;步骤二:对预处理后得到的图像进行基于超图的图像表示;步骤三:对构建好的超图进行基于超图学习的超像素分割;步骤四:对输入图像所对应的分割结果进行后处理,包括增强连通性和超像素边界优化两部分。本发明首次将超图的思想引入超像素分割,以此来编码像素之间的高阶关系;利用自适应近邻方法构建超边,有利于准确刻画顶点与超边之间的连接强度;结合Canny算子对超像素边界进行优化,确保进一步提升边界召回率。
-
公开(公告)号:CN111709442A
公开(公告)日:2020-09-25
申请号:CN202010377838.8
申请日:2020-05-07
Applicant: 北京工业大学
IPC: G06K9/62
Abstract: 一种面向图像分类任务的多层字典学习方法,其能够解除多个字典之间关系定义的局限性,提升字典学习应用于分类问题的精度。这种面向图像分类任务的多层字典学习方法,用于提取图像样本中的类别信息,包括:(1)将多层字典之间的依赖关系定义为残差学习,基于多层残差判别字典学习框架来学习多层字典及分类器;(2)基于步骤(1)学习的多层字典依次计算待分类数据的多轮编码向量,再利用相应的分类器进行分类,加和各分类器预测值得到最终识别结果。
-
-
-
-
-
-
-
-
-