-
公开(公告)号:CN106331680B
公开(公告)日:2018-05-29
申请号:CN201610657639.6
申请日:2016-08-10
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
IPC: H04N13/261
Abstract: 本发明公开了一种手机端2D转3D自适应云卸载的方法和系统,该方法包括如下步骤:A1.输入一帧2D单目图像,将图像等分成N个图像块;A2.将图像块进行分类,分类为远景视图、线性视图和普通视图;A3.根据已划分视图的类别,分别计算每个图像块深度估计的算法复杂度;A4.将每个图像块的算法复杂度,代入云端卸载动态资源分配模型,最优化得到分配结果;A5.按照A4得到的分配结果,分别在手机端和云端进行深度估计,生成深度图。该方法和系统通过建立云端卸载动态资源分配模型,形成基于云计算的手机端2D转3D的自适应卸载方法和系统,将手机端复杂的计算卸载到云端,从而释放手机端的存储资源,提高手机的处理速度,降低手机的功耗;同时获得深度估计合理,运行速度高效的高质量深度图。
-
公开(公告)号:CN107909034A
公开(公告)日:2018-04-13
申请号:CN201711132667.7
申请日:2017-11-15
Applicant: 清华大学深圳研究生院
CPC classification number: G06K9/00241 , G06K9/6256
Abstract: 本发明公开了人脸检测方法、装置和计算机可读存储介质,方法包括模型训练和人脸检测;训练过程是采用正、负样本图像及其标准像素差特征,来构建深度二次树,再通过多个深度二次树组成随机森林来进行人脸检测跟踪。训练过程中每得到一次随机森林后都进行测试,看是否能够正确检测到人脸,并把检测错误的图像更新到相应的训练集中继续进行不断的训练学习,直至得到检测效果符合预期的随机森林。检测时将待检测图像的特征输入到随机森林,通过其每一个二次树分别进行判断,再对所有二次树的判断结果进行统计,根据统计结果判定是否为人脸图像。具有使用较少训练样本得到较高精度的检测模型的优点,尤其适合对有遮挡的人脸进行检测的场合。
-
公开(公告)号:CN106162164A
公开(公告)日:2016-11-23
申请号:CN201610643932.7
申请日:2016-08-08
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
CPC classification number: H04N17/00 , H04N13/106 , H04N2013/0074
Abstract: 本发明公开了一种融合神经种群编码模型的3D主观质量预测方法,包括:S1、建立基于支持向量回归的3D主观质量预测模型;S2、基于失真深度图得到视差图;S3、计算视差图在神经种群编码模型下的13维响应;S4、将上述13维响应联合深度图的纹理特征和失真特征参数作为模型的输入,得到3D图像体验质量值。本发明能够以数学模型的形式,融合深度图的纹理特征和计算神经学的神经种群编码模型响应预测其合成图的3D图像体验质量值,对探究多视点视频的体验质量及优化多视点视频编码具有重要的意义。
-
公开(公告)号:CN103533332B
公开(公告)日:2016-01-20
申请号:CN201310501309.4
申请日:2013-10-22
Applicant: 清华大学深圳研究生院
Abstract: 一种2D视频转3D视频的图像处理方法,包括:将从不同角度所拍摄的目标物体的图像作为样本图像;计算每个样本图像和待识别图像的颜色不变量图像,提取颜色不变量图像中的特征点;将待识别图像的颜色不变量图像中的特征点与样本图像的颜色不变量图像中的特征点进行匹配;根据匹配成功的特征点的分布情况,判断待识别图像中是否存在目标物体;如果待识别图像中存在目标物体,基于匹配成功的特征点将目标物体轮廓分割出来。该方法可以在2D视频转3D视频过程中对目标物体进行识别并精确分割物体轮廓,并极大地减少人工操作的工作量。
-
公开(公告)号:CN103186899B
公开(公告)日:2015-11-11
申请号:CN201310091386.7
申请日:2013-03-21
Applicant: 清华大学深圳研究生院
IPC: G06T7/00
Abstract: 一种仿射尺度不变的特征点提取方法,包括:根据摄像机仿射模型确定倾斜量参数和经度参数,对要匹配的两幅图像分别做仿射变换,模拟图像可能发生的仿射扭曲;检测经过仿射变换的图像中的最大稳定极值区域(MSER),并采用用椭圆区域方程拟合检测到的每个MSER;进而通过DoG高斯差分算子检测MSER区域中特征点并根据特征点所在位置及尺度信息生成对应的特征点描述算子。本方法能够精确提取图像中仿射不变和尺度不变的特征点,在图像产生较大的倾斜时仍能检测到较多的特征点,具有很好的抗仿射性。同时,采用MSER区域的检测,能够减少特征点的检测范围,减少误匹配,增加算法的执行效率。
-
公开(公告)号:CN102819840B
公开(公告)日:2014-10-29
申请号:CN201210259652.8
申请日:2012-07-25
Applicant: 清华大学深圳研究生院
IPC: G06T7/00
Abstract: 本发明公开了一种纹理图像分割方法,提取图像的局部的各种特征信息表征图像中不同纹理的区域的特性得到特征图像,通过主成分分析等手段降低数据量再通过mean shift算法(中文名为:均值漂移算法)对特征向量进行聚类,从而完成较可靠的纹理图像分割。本发明相对于现有技术,图像分割可靠性高,人机交互少的有益效果。
-
公开(公告)号:CN103533332A
公开(公告)日:2014-01-22
申请号:CN201310501309.4
申请日:2013-10-22
Applicant: 清华大学深圳研究生院
Abstract: 一种2D视频转3D视频的图像处理方法,包括:将从不同角度所拍摄的目标物体的图像作为样本图像;计算每个样本图像和待识别图像的颜色不变量图像,提取颜色不变量图像中的特征点;将待识别图像的颜色不变量图像中的特征点与样本图像的颜色不变量图像中的特征点进行匹配;根据匹配成功的特征点的分布情况,判断待识别图像中是否存在目标物体;如果待识别图像中存在目标物体,基于匹配成功的特征点将目标物体轮廓分割出来。该方法可以在2D视频转3D视频过程中对目标物体进行识别并精确分割物体轮廓,并极大地减少人工操作的工作量。
-
-
公开(公告)号:CN105959665B
公开(公告)日:2018-08-07
申请号:CN201610296758.3
申请日:2016-05-05
Applicant: 清华大学深圳研究生院 , 深圳市未来媒体技术研究院
IPC: H04N13/243 , H04N13/122 , H04N13/344 , G06T3/40
Abstract: 本发明公开了种针对于虚拟现实设备的全景3D视频生成方法,包括:用广角相机阵列拍摄场景视频并经过拼接算法生成全景视频;用深度相机阵列拍摄场景的深度图并经过拼接算法生成全景深度图视频。通过实时检测人的头部位置,在全景视频帧中切割相应位置的图像作为左视点的视频;根据左视点的图像和相应的深度图基于虚拟视点合成技术外插生成右视点图像,这两幅图像拼接为左右3D视频,在虚拟现实设备中显示。本发明通过在虚拟现实设备显示的全景视频中,加入视点合成技术,使观看者能看到全景视频的3D效果,增加了场景的逼真性,进而提升了观者的体验感。
-
公开(公告)号:CN104021549A
公开(公告)日:2014-09-03
申请号:CN201410212300.6
申请日:2014-05-19
Applicant: 清华大学深圳研究生院
Abstract: 本发明公开了全仿射不变SURF特征点检测方法及装置,方法包括如下步骤:CPU将原始图像的原始像素值依次线性地存储到存储器的第一存储空间内;仿射变换模块根据Flash存储器存储的原始像素坐标与目标像素坐标的坐标对应关系,查找与原始像素坐标对应的目标像素坐标,将原始像素值存储到目标像素坐标对应的第二存储空间内;FPGA的插值模块对存储于第二存储空间内的仿射变换后图像进行处理得到最终像素值;CPU将原始图像进行积分运算后得到积分图像:CPU将积分图像的积分像素值依次线性地存储到存储器的第四存储空间内;FPGA的滤波模块利用盒式滤波器对积分图像进行滤波处理;FPGA的Hession矩阵计算模块根据滤波结果计算Hession矩阵。
-
-
-
-
-
-
-
-
-