-
公开(公告)号:CN106202413B
公开(公告)日:2018-11-20
申请号:CN201610544156.5
申请日:2016-07-11
Applicant: 北京大学深圳研究生院
IPC: G06F17/30
Abstract: 本发明公布了一种新的跨媒体检索方法,利用VGG提出的卷积神经网络VGG net提取图像特征,将VGG卷积神经网络中的第七层全连接层fc7通过ReLU激活函数之后的4096维特征作为图像特征;利用基于Word2vec的Fisher Vector提取文本特征,通过逻辑回归的方法对异构图像、文本特征进行语义匹配,通过基于逻辑回归的语义匹配方法找到图像、文本这两种异构特征之间的关联,从而实现跨媒体检索;本发明的特征提取方法能有效地表示图像和文本的深层语义,可提高跨媒体检索的准确度,从而大幅度提升跨媒体检索效果。
-
公开(公告)号:CN105517677B
公开(公告)日:2018-10-12
申请号:CN201580000247.6
申请日:2015-05-06
Applicant: 北京大学深圳研究生院
Abstract: 一种深度图/视差图的后处理方法和装置,在进行不整齐边缘区域检测时,采用边缘信息与分块信息相结合的思路。对彩色图像进行图像分块时,先对彩色图像进行超像素分割;将灰度范围分为预设个区间,对于每个超像素,统计得到所有像素点落在所述区间内的直方图;判断当前超像素中,区间分布值最大的区间所含的像素数与当前超像素中的全部像素数的比值是否小于第一阈值,如果是,则采用基于颜色分块的方法对当前超像素进行进一步分割。在保证图像处理速度的同时,提高彩色图像分割的准确性,从而提高不整齐边缘区域检测的准确性。
-
公开(公告)号:CN108319686A
公开(公告)日:2018-07-24
申请号:CN201810101127.0
申请日:2018-02-01
Applicant: 北京大学深圳研究生院
Abstract: 本发明公布了一种基于受限文本空间的对抗性跨媒体检索方法,设计特征提取网络、特征映射网络和模态分类器,通过学习得到受限文本空间,提取适用于跨媒体检索的图像和文本特征,实现图像特征从图像空间到文本空间的映射;通过对抗性训练机制使得学习过程中不断减小不同模态数据之间特征分布的差异性;由此实现跨媒体检索。本发明能够更好地拟合人类在跨媒体检索任务中的行为表现;得到更适用于跨媒体检索任务的图像和文本特征,弥补了预训练特征在表达能力上的欠缺;引入对抗性学习的机制,通过模态分类器与特征映射网络之间的最大最小博弈,进一步提升了检索准确率。
-
公开(公告)号:CN107622474A
公开(公告)日:2018-01-23
申请号:CN201710882161.1
申请日:2017-09-26
Applicant: 北京大学深圳研究生院
IPC: G06T3/00
Abstract: 本发明公布了一种新的全景视频非对称映射方法及相应的反映射方法,通过映射方法将全景图像或视频A所对应的球面映射到二维图像或视频B上;先将球面投影到底面为方形的等腰四棱锥上,再进一步将四棱锥投影到平面上;投影中对主视点的区域使用等角投影并使用较高的采样密度,保证主视点的区域的视频质量较高,对非主视点区域使用较低的采样密度以节省码率。该全景视频非对称映射技术在保证主视点区域视频质量不变的情况下,大大降低视频其余区域的分辨率,有效地节省了虚拟现实视频编码所需的码率。全景视频非对称反映射技术提供了从平面映射回球面的方法,通过此方法可将平面视频映射回球面进行渲染观看。
-
公开(公告)号:CN107316031A
公开(公告)日:2017-11-03
申请号:CN201710536020.4
申请日:2017-07-04
Applicant: 北京大学深圳研究生院
Abstract: 本发明公布了一种用于行人重识别的图像特征提取方法,通过对齐局部描述子提取和分级全局特征提取,进行行人重识别;对齐局部描述子提取采用仿射变换对原图像进行处理,对相同区域的图像块特征进行求和池化操作而得到对齐局部描述子;对齐局部描述子保留图像内部块与块之间的空间信息;分级全局特征提取通过对定位的行人区域块进行分级,求取相应特征均值而得到全局特征。采用本发明技术方案,能够解决行人重识别中由于行人姿态变化等带来的特征不对齐问题,消除无关背景对重识别带来的影响,由此提高行人重识别的精度和鲁棒性。
-
公开(公告)号:CN103974078B
公开(公告)日:2017-10-31
申请号:CN201410127457.9
申请日:2014-03-31
Applicant: 北京大学深圳研究生院
IPC: H04N19/587 , H04N19/523
Abstract: 本申请公开了一种针对色度的插值方法,包括:确定插值的像素精度;在整像素点之间确定插入分像素的点的坐标;根据所述坐标,使用低抽头插值滤波器对插入的分像素进行二维分离插值。本申请还公开一种滤波器。在本申请的具体实施方式中,由于在像素点之间确定插入分像素的点的坐标,根据坐标,使用低抽头插值滤波器,如4抽头插值滤波器,对插入的分像素进行二维分离插值,对于双线性插值来说,提高了插值性能。
-
公开(公告)号:CN103747269B
公开(公告)日:2017-09-19
申请号:CN201310465557.8
申请日:2013-09-30
Applicant: 北京大学深圳研究生院
Abstract: 本申请公开了一种滤波器插值方法,包括:获取视频数据序列的序列信息;根据所述序列信息和预定规则确定所使用的插值滤波器;确定像素精度,并根据所述像素精度和所述插值滤波器的系数,插入分像素点。本申请还公开了一种滤波器。在本申请的具体实施方式中,根据序列信息和预定规则确定所使用的插值滤波器,并根据像素精度和抽头插值滤波器的系数,计算插入的分像素点,本申请可根据序列信息,自动选择插值滤波器的抽头数,自适应地插入分像素点,提高了编码性能,降低了其插值计算的复杂度。
-
公开(公告)号:CN103412874B
公开(公告)日:2017-08-29
申请号:CN201310290469.9
申请日:2013-07-11
Applicant: 北京大学深圳研究生院
IPC: G06F17/30
Abstract: 本申请公开了一种用于实现三维网页的方法及系统,利用在HTML语言中定义的视帧标签、在CSS语言中定义的三维定位信息属性组以及在JavaScript语言中定义的显示格式对象创建三维页面文件,并且对三维页面文件进行解析并相应建立视帧对应的文档对象模型树,最后对文档对象模型树进行三维渲染,依据显示格式显示渲染所得三维页面。这样,采用上述处理方式就能实现双视点或多视点三维网页,在双视点或多视点3D显示器上呈现具有深度感的立体三维网页世界,革新了网络体验。
-
公开(公告)号:CN106127691A
公开(公告)日:2016-11-16
申请号:CN201610543056.0
申请日:2016-07-12
Applicant: 北京大学深圳研究生院
CPC classification number: G06T3/40 , G06T3/4007 , G06T3/4038 , G06T9/00
Abstract: 本发明公布了一种全景图像映射方法,针对分辨率为2M×M的矩形映射全景图像,根据纬度设置映射区域和非映射区域,只将设置的映射区域映射为方形区域包括:对于所述方形区域上的点,计算得到该点到方形区域中心的垂直距离和水平距离,取其中较大者记为m;计算得到该点到同心方形上第零个点的距离n;计算得到该点所对应的经度和纬度;计算得到该点反映射到矩形映射全景图像中所对应的位置(X,Y);再给该点赋值。本发明方法可有效降低过采样,由此达到在失真较小的情况下有效降低全景图像的像素数和编码所需的码率的目的。
-
公开(公告)号:CN105517671A
公开(公告)日:2016-04-20
申请号:CN201580000102.6
申请日:2015-05-25
Applicant: 北京大学深圳研究生院
IPC: A99Z99/00
Abstract: 一种基于光流法的视频插帧方法及系统,其过程为:对输入的视频的帧序列,采用光流法计算得到相邻两帧之间的双向运动矢量;判断相邻两帧之间的双向运动矢量是否可靠,对光流法的锯齿问题和噪声问题进行处理;对相邻两帧中的“遮挡”和“暴露”区域进行标记,对不可靠的运动矢量进行更新处理;对于相邻两帧,根据“遮挡”和“暴露”区域的标记信息以及更新处理后所得的双向运动矢量场,将前后帧向内插帧映射得到前向内插帧和后向内插帧;将前向内插帧和后向内插帧合成成内插帧;对内插帧中的洞点进行修补;得到最终的内插帧。本发明的帧率上转换采用光流法计算得到相邻两帧之间的双向运动矢量,其基于的是像素,因此更加精确,不存在块效应等问题。
-
-
-
-
-
-
-
-
-