-
公开(公告)号:CN113239943A
公开(公告)日:2021-08-10
申请号:CN202110595282.4
申请日:2021-05-28
Applicant: 北京航空航天大学
Abstract: 本发明公开了一种基于部件语义图的三维部件提取组合方法和装置。该方法的一具体实施方式包括:对目标图片进行部件级语义分割以生成至少一个部件分割图;对三维体素模型库中每个三维体素模型进行特征提取以生成多尺度立方体平均场描述子,得到至少一个多尺度立方体平均场描述子;基于该至少一个多尺度立方体平均场描述子,将该至少一个部件分割图中的每个部件分割图作为网络输入进行网络训练;将训练所得到的至少一个特征部件组合成目标体素模型。该实施方式提高了基于图片提取三维模型的精确度。
-
公开(公告)号:CN109919110B
公开(公告)日:2021-06-04
申请号:CN201910189770.8
申请日:2019-03-13
Applicant: 北京航空航天大学
IPC: G06K9/00
Abstract: 本发明实施例提供一种视频关注区域检测方法、装置及设备,该方法包括:获得时空联合模型,时空联合模型用于获得视频帧图像中的关注区域,关注区域由时域特征和空域特征表征;时空联合模型根据学生模型生成,学生模型包括用于获得时域特征的时域子模型和用于获得空域特征的空域子模型,时域子模型是根据学生模型对应的时域教师模型生成,空域子模型是根据学生模型对应的空域教师模型生成;将待检测的视频帧图像输入时空联合模型,得到待检测的视频帧图像的关注区域。本发明可以在保证关注区域检测精度的基础上降低模型的复杂度。
-
公开(公告)号:CN111970536A
公开(公告)日:2020-11-20
申请号:CN202010728311.5
申请日:2020-07-24
Applicant: 北京航空航天大学
IPC: H04N21/233 , H04N21/234 , H04N21/2343 , H04N21/845 , G10L25/24 , G06K9/00
Abstract: 本公开的实施例公开了一种基于音频生成视频方法和装置。该方法的一具体实施方式包括:获取舞蹈视频和音乐片段;确定音频的音频点,得到多个影像点;利用影像得到多个人体关键点集和影像片段;利用每个音频点和影像点确定训练集和舞蹈动作库;确定音频点的特征向量和影像片段的特征向量,得到训练后的特征提取器;利用训练后的特征提取器,提取音乐片段特征;确定音乐片段特征和人体关键点特征距离,得到影像片段并合成视频。该实施方式实现了根据音乐生成更生动流畅的舞蹈的方法,提高了用户体验,为用户的生活提供了便利。
-
公开(公告)号:CN111967467A
公开(公告)日:2020-11-20
申请号:CN202010723955.5
申请日:2020-07-24
Applicant: 北京航空航天大学
Abstract: 本公开的实施例公开了图像目标检测方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:对目标图像进行区域分割,得到至少一个图像区域;对至少一个图像区域中每个图像区域进行特征提取,得到至少一个特征图;根据至少一个特征图和至少一个图像区域,生成语义关系图和空间分布关系图;根据语义关系图和空间分布关系图,生成图像区域关系图;根据图像区域关系图,从至少一个图像区域中确定目标图像区域;将目标图像区域进行显示。该实施方式实现了用户体验的提升和网络流量的增长。
-
公开(公告)号:CN106952269B
公开(公告)日:2019-09-20
申请号:CN201710104243.3
申请日:2017-02-24
Applicant: 北京航空航天大学
Abstract: 本发明提供一种近邻可逆的视频前景物体序列检测分割方法及系统,其中,方法包括:将视频的每一视频帧划分为超像素块;利用视觉关注属性特征表征每一个超像素块;构建并训练深度神经网络,预测每一个超像素块在空域上的初始前景度值;利用视觉关注属性特征在不同视频帧之间构建近邻可逆矩阵;利用近邻可逆矩阵传播超像素块的初始前景度值,构建迭代优化问题,求解超像素块在时空域上的最终前景度值;将超像素块的最终前景度值进行像素级转化;采用形态学平滑操作对像素的最终前景度值进行优化处理;根据像素的最终前景度值判定所述像素是否属于视频前景物体序列。本发明处理视频无需设置先验假定条件,尤其适用于包含复杂场景的大数据集。
-
公开(公告)号:CN110197213A
公开(公告)日:2019-09-03
申请号:CN201910424840.3
申请日:2019-05-21
Applicant: 北京航空航天大学
IPC: G06K9/62
Abstract: 本发明提供一种基于神经网络的图像匹配方法、装置和设备。该基于神经网络的图像匹配方法包括:将待匹配图像组输入神经网络模型,得到该待匹配图像组对应的特征向量;其中,该待匹配图像组包括至少两个待匹配图像;将该待匹配图像组对应的特征向量输入到神经网络模型全连接层的权重矩阵,得到图像匹配模型;将目标图像输入至该图像匹配模型,在该待匹配图像组中除该目标图像之外的其它待匹配图像中,确定与该目标图像匹配的至少一个匹配图像;其中,该目标图像为该待匹配图像组中的任一图像。该方法可以提高图像匹配的准确度。
-
公开(公告)号:CN109543561A
公开(公告)日:2019-03-29
申请号:CN201811290665.5
申请日:2018-10-31
Applicant: 北京航空航天大学
Abstract: 本发明实施例提供一种航拍视频显著性区域检测方法和装置。包括:获取样本数据集分别对应M个地面级经典显著性模型的样本显著图集合;初始化M个单路卷积神经网络,利用样本数据集和样本显著图集合训练M个单路卷积神经网络,获取训练后的M个卷积神经网络模型;利用N个单路卷积神经网络模型初始化N路卷积神经网络,利用样本数据集训练N路卷积神经网络,获取训练后的N路卷积神经网络模型;根据训练后的N路卷积神经网络获取待检测数据集的空域显著图集合;根据DCT方法获取待检测数据集的时域显著图集合;根据空域显著图集合和时域显著图集合,得到待检测数据集的时空显著图集合。获得显著性区域集中且清晰的航拍视频的显著图集合。
-
公开(公告)号:CN104778704B
公开(公告)日:2017-07-21
申请号:CN201510185348.7
申请日:2015-04-20
Applicant: 北京航空航天大学
IPC: G06T7/10
Abstract: 本发明涉及一种基于随机扫视图稀疏信号重构的图像关注区域检测方法,首先对每一张图像生成一系列的随机扫视图,并且每一次扫视端点的圆形区域可以实际被记录到。随后,将圆形区域内的视觉刺激传递到我们的大脑进行编码并且使用预先训练好的稀疏基元进行信号重构。在这个过程中,人眼视点一直被锁定在观测区域内,直到该观测区域内的视觉刺激被充分认知。停留时间可以通过稀疏基元的激活代价和稀疏重构误差来计算。在经过每一次扫视之后图像的显著度可以由图像的每一个图像块内观测区域视点的停留时间来衡量,综合每一次扫视之后的图像显著度即可得到最终的图像显著图。本发明引入了稀疏编码,图像显著性检测过程更符合人类视觉系统观测图像。
-
公开(公告)号:CN106156781A
公开(公告)日:2016-11-23
申请号:CN201610545516.3
申请日:2016-07-12
Applicant: 北京航空航天大学
Abstract: 本发明提供一种排序卷积神经网络构建方法及其图像处理方法与装置,该排序卷积神经网络中包括了排序层,排序层用于对所述排序层的前一层的输出结果进行排序处理,按照排序结果生成所述排序层的输出结果,并将所述排序层的输出结果输出到所述排序层的后一层,使用该排序卷积神经网络能够通过自动学习来获取输入特征图对应的输出特征,相比于现有技术通过手工计算获取特征的方法,本发明的方法能够更好的反映真实场景素材蕴含的客观规律,将该方法应用于图像处理领域时,就能够使得图像处理的效果得到大幅提升。
-
公开(公告)号:CN114154563B
公开(公告)日:2024-06-25
申请号:CN202111355318.8
申请日:2021-11-16
Applicant: 北京航空航天大学
IPC: G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084
Abstract: 本发明提出了基于混合监督训练的目标检测方法,从分析目标检测器训练过程中使用的训练数据集标注策略入手,提出使用部分全标注数据和部分弱监督标注数据进行混合训练的目标检测方法。方法通过使用峰值类别激活响应机制,训练时对于弱标注数据,建模物体类别标签与粗粒度位置信息的映射,辅助检测分支训练;对于全标注数据训练模型分类和定位分支。最后将两个分支的结果自适应的融合,提升目标检测器的性能。一方面,本专利提出了一个基于峰值类别激活响应的混合监督训练目标检测器的训练方法,在保证性能同时显著降低训练成本,另一方面,该方法与现有目标检测器相结合,显著降低训练成本,同时一定程度上提升检测性能。
-
-
-
-
-
-
-
-
-