-
公开(公告)号:CN117173232A
公开(公告)日:2023-12-05
申请号:CN202310937667.3
申请日:2023-07-27
Applicant: 北京邮电大学
IPC: G06T7/55 , G06T5/50 , G06T19/20 , G06N3/0475 , G06N3/09
Abstract: 本发明提供一种深度图像的获取方法、装置及设备,该方法包括:获取目标三维场景的原始RGB图像和原始深度图像;将所述原始RGB图像,输入至色彩深度信息融合模型中的特征金字塔网络,得到多个图像特征;将所述多个图像特征和所述原始深度图像,输入至所述色彩深度信息融合模型中的深度图像生成网络,得到所述目标三维场景的目标深度图像。本发明提供一种深度图像的获取方法、装置及设备用于提高深度图像的准确率。
-
公开(公告)号:CN116645456A
公开(公告)日:2023-08-25
申请号:CN202310390854.4
申请日:2023-04-12
Applicant: 北京邮电大学
IPC: G06T13/40 , G10L25/03 , G10L25/63 , G10L25/30 , G10L21/10 , G06V40/16 , G06V10/82 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明涉及人机交互技术领域,尤其涉及一种语音驱动数字人面部动画生成方法和装置。其中,语音驱动数字人面部动画生成方法包括,首先获取音频数据;对音频数据进行特征提取,得到对应的音频特征;然后将音频特征输入到训练好的面部关键点确定模型中,得到音频特征对应的面部关键点位置;面部关键点确定模型为根据音频特征和数字面部关键点位置的对应关系训练得到的;最后,根据面部关键点位置和数字人面部模板数据生成三维面部动画。可见,依据本发明提供的方法,可以采用音频数据对数字人面部进行驱动,避免了用户佩戴头戴式显示设备导致的身体疲劳的情况,同时使得数据人面部动作自然、切近真实人脸动作,使得人机交互效果更好。
-
公开(公告)号:CN116543452A
公开(公告)日:2023-08-04
申请号:CN202310363839.0
申请日:2023-04-06
Applicant: 北京邮电大学
Abstract: 本发明提供一种手势识别、手势交互方法及装置,手势识别方法包括:确定待识别手部关键点数据;将所述待识别手部关键点数据输入手势识别模型,得到所述待识别手部关键点数据对应的目标手势类别;其中,所述手势识别模型是基于样本手部关键点数据以及所述样本手部关键点数据对应的手势类别标签训练得到的,所述样本手部关键点数据是初始样本手部关键点数据进行位姿归一化后获得的。本发明能够实现准确且快速的手势识别,还可以实现多种功能的人机交互,具有较高的稳定性和鲁棒性。
-
公开(公告)号:CN116543099A
公开(公告)日:2023-08-04
申请号:CN202310278301.X
申请日:2023-03-20
Applicant: 北京邮电大学
Abstract: 本发明提供一种三维图像重建方法、装置及设备,包括:获取待扫描对象的多个彩色图像对;彩色图像对中包括双目相机的左眼相机拍摄得到的左彩色图像和右眼相机拍摄得到的右彩色图像;确定多个彩色图像对各自对应的视差图像对和初始深度图像对,并基于多个视差图像对和多个初始深度图像对确定目标深度图像对;基于目标深度图像对和目标深度图像对对应的彩色图像对进行三维重建,得到待扫描对象的三维图像。本发明提供的三维图像重建方法、装置及设备用于提高三维图像的质量。
-
公开(公告)号:CN116528065A
公开(公告)日:2023-08-01
申请号:CN202310787597.8
申请日:2023-06-30
Applicant: 深圳臻像科技有限公司 , 北京邮电大学
IPC: H04N23/957 , H04N13/117 , H04N13/15 , G06T15/00
Abstract: 本发明涉及光场显示技术领域,为了解决现有数据处理算法不足导致的实时性和保真性低的技术问题,本发明公开了一种高效虚拟场景内容光场获取与生成方法,根据光场视角以及所需视点数,设定虚拟相机位置,通过指定虚拟相机获取彩色视频流和深度视频流,通过光场编码模块对视频流编码,压缩上传云端传输;通过在预定位置的虚拟相机,实时获取虚拟场景的彩色视频流和深度视频流,并从云端实现远端到本地端传输,获取单帧对应的彩色图与深度图,经过光场编码后进行具有高保真和实时性的远程渲染,能够极大地降低传输成本,解决了通过模型传输代价高、无法实时的问题,同时保证了光场下的渲染精度,满足了高保真和实时的传输和生成需求。
-
公开(公告)号:CN116418961A
公开(公告)日:2023-07-11
申请号:CN202310678853.X
申请日:2023-06-09
Applicant: 深圳臻像科技有限公司 , 北京邮电大学
IPC: H04N13/111 , G06T15/02 , G06N3/04 , G06N3/08
Abstract: 本发明适用于图像处理技术领域,提供了一种基于三维场景风格化的光场显示方法及系统,包括以下步骤:对同一个静态场景进行多视角采集得到多视点图像;对多视点图像进行预处理得到相机内参、相机外参和拍摄位姿信息;将多视点图像、相机内参、相机外参以及拍摄位姿信息输入至神经网络中学习,获得三维隐式表达的真实场景的辐射场;通过神经网络和图像处理将所述的真实场景的辐射场转化为风格化辐射场,实现从真实场景到风格化场景的映射;通过生成虚拟相机阵列重新采集多视点图像,并进行多视点合成编码,加载到三维光场显示器上进行立体显示。本发明能够对三维场景进行视觉上富有美感的风格化并用于三维显示,三维显示效果好。
-
公开(公告)号:CN115236871A
公开(公告)日:2022-10-25
申请号:CN202210540211.9
申请日:2022-05-17
Applicant: 北京邮电大学 , 深圳臻像科技有限公司
IPC: G02B30/33 , H04N13/368 , G02B30/30 , G09G3/34
Abstract: 本发明涉及三维显示技术领域,为了解决现有三维显示系统在多人应用场景下无法高清显示的技术问题,本发明公开了基于人眼跟踪和双向背光的桌面式光场显示系统及方法,包括液晶显示屏、双向背光单元和控光器件,还设置有渲染装置和人眼跟踪装置,渲染装置根据不同观看者人眼位置信息渲染合成出适应不同的观看区域的3D图像。双向背光单元可以在桌面式光场显示器两侧分别构造三维场景各自侧面的视差信息,以满足多人多方向观看的实际需求,人眼跟踪装置可以实时跟踪人眼位置,单独为其提供视野范围内的三维图像,消除现有三维显示系统造成的视觉疲劳、视区跳变和分辨率低等不足,实现高刷新率、高分辨率的三维图像显示。
-
公开(公告)号:CN114675429A
公开(公告)日:2022-06-28
申请号:CN202210260857.1
申请日:2022-03-16
Applicant: 北京邮电大学
IPC: G02B27/28
Abstract: 本发明实施例涉及光学成像领域,公开了一种光学成像系统及成像装置。该光学成像系统包括按照待成像对象出射光线的传输方向,顺次排列的第一分光元件、第一光学相位调制元件和第二分光元件,该第一分光元件的入射光线是第一偏振方向的偏振光,第一分光元件透射第一偏振方向的偏振光,反射第二偏振方向的偏振光,第一偏振方向与第二偏振方向正交。该第一光学相位调制元件是四分之一波片。第二分光元件反射第一光学相位调制元件出射的部分光线,透射第一光学相位调制元件出射的另一部分光线。这样的设置,无需倾斜放置任一光学元件,使得各个光学元件占用的空间较小,从而能够缩小成像装置的体积。
-
公开(公告)号:CN111780955B
公开(公告)日:2021-07-06
申请号:CN202010538250.6
申请日:2020-06-12
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种用于光栅立体显示器的光栅参数测量方法及系统,该方法包括:获取待测量的光栅立体显示器的三维显示图像;将所述三维显示图像输入到训练好的光栅参数测量模型中,得到所述待测量的光栅立体显示器的光栅参数值,其中,所述训练好的光栅参数测量模型是由样本三维显示图像,通过DQN算法对两个结构相同的卷积神经网络进行训练得到的。本发明通过使用DQN算法进行光栅参数的匹配,针对不同的光栅显示器,具有普适性,提高了光栅参数测量效率和精度。
-
公开(公告)号:CN111813470B
公开(公告)日:2021-03-23
申请号:CN202010537425.1
申请日:2020-06-12
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种初始交互界面优化方法及装置,该方法包括:获取交互界面目标区域,对交互界面目标区域进行视觉显著性优化,得到视觉增强交互界面;将所述视觉增强交互界面中的文本内容进行潜在语义分析,并根据潜在语义分析结果对文本内容分组优化,得到分组后的文本内容,根据分组后的文本内容对视觉增强交互界面进行优化,得到优化后的初始交互界面。通过以不同的背景颜色呈现目标区域,其能够显著的吸引用户的注视,并且同步将文本内容进行分组优化,将相似度高的文本分为一组,有效减少对该组中的所有文本进行搜索的时间,最终减少了初学者用户对于初始交互界面的认识负荷,提高了认识成功率,有效改善了初学者用户的体验。
-
-
-
-
-
-
-
-
-