-
公开(公告)号:CN113935907B
公开(公告)日:2025-04-01
申请号:CN202111052841.3
申请日:2021-09-06
Applicant: 北京邮电大学
IPC: G06T5/80 , G06T5/60 , G06N3/0455 , G06N3/0464 , G06F3/14
Abstract: 本申请公开了一种预校正图像像差的方法、装置、电子设备及介质。本申请中,可以获取无像差的基元图像;利用卷积神经网络模型对无像差的基元图像进行像差预校正,得到多个第一预校正图像,以及利用维纳滤波器对无像差的基元图像进行像差预校正,得到多个第二预校正图像;将多个第一预校正图像以及第二预校正图像进行图像拼接,得到对应的多个联合预校正基元图像;在多个联合预校正基元图像中,选取图像指标值最高的图像作为目标预校正图像。通过应用本申请的技术方案,可以通过预先训练得到的卷积神经网络模型训练模型以及维纳滤波器以实现对系统中透镜像差预先的校正处理,从而在不增加系统复杂度的前提下用于抑制各种程度的透镜像差对光场显示设备带来的影响的目的。
-
公开(公告)号:CN114429496B
公开(公告)日:2025-03-14
申请号:CN202111520396.9
申请日:2021-12-13
Applicant: 北京邮电大学
IPC: G06T7/593 , G06N3/0464 , G06N3/096 , G06N3/09 , G06N3/0985
Abstract: 本发明提供一种基于可学习超像素引导的视差优化方法及装置,其中方法包括:获取用户输入的第一图和第二图;将第一图和第二图输入至视差优化模型,获得视差优化模型输出的视差图;其中,第一图和第二图是由双目摄像机对同一拍摄对象拍摄获得的;视差优化模型是基于数据集进行训练后得到的,用于在超像素引导下对视差进行优化;数据集包括图片样本以及对应的真实语义图、空间位置图和真实视差图;真实语义图、空间位置图和真实视差图是根据图片样本预先确定的,并与图片样本一一对应。本发明实施例提供的基于可学习超像素引导的视差优化方法及装置,实现了超像素网络和视差网络之间的有效交互。
-
公开(公告)号:CN116246146A
公开(公告)日:2023-06-09
申请号:CN202310193999.5
申请日:2023-02-24
Applicant: 北京邮电大学
IPC: G06V10/82 , G06V10/774 , G06N3/0464 , G06N3/0442 , G06N3/08 , G06V10/80
Abstract: 本发明提供一种模型训练方法、人眼注视区域预测方法及装置,其中模型训练方法,包括:获取样本两视点视频数据集,样本两视点视频数据集包括三维动态场景下拍摄的多个样本两视点视频数据;基于样本两视点视频数据集,对初始人眼注视区域预测模型进行训练,确定预设人眼注视区域预测模型;其中,初始人眼注视区域预测模型包括基于卷积神经网络建立的自底向上注意力机制子模型和基于长短时记忆网络建立的自顶向下注意力机制子模型。本发明实现了建立适用于三维动态场景下视觉注意力机制模型目的,大幅提高了人眼注视区域预测结果的预测精度,同时也大幅提高了训练所得预设人眼注视区域预测模型的适用范围。
-
公开(公告)号:CN114237001B
公开(公告)日:2023-02-03
申请号:CN202111481395.8
申请日:2021-12-06
Applicant: 北京邮电大学
Abstract: 本发明提供一种双目全息三维显示系统及其方法,其中系统包括:分光棱镜、第一反射镜、第二反射镜、空间光调制器和全息光学元件,其中:分光棱镜用于将获取到的平行光束分为第一光束和第二光束,所述第一光束照射到空间光调制器上,第二光束照射到第一反射镜上;第一反射镜用于将第一光束照射到空间光调制器上;空间光调制器用于产生第一全息图像光和第二全息图像光;第二反射镜用于将全息图像光照射至全息光学元件上;全息光学元件用于获取第一全息图像光和第二全息图像光,并生成全息三维图像。本发明通过分别将第一全息图像光和第二全息图像光分别照射第一全息元件和第二全息元件上,将左右眼全息图像重建出来,准确的形成全息三维图像。
-
公开(公告)号:CN113223144B
公开(公告)日:2022-06-21
申请号:CN202110405740.3
申请日:2021-04-15
Applicant: 北京邮电大学
Abstract: 本发明提供一种三维显示海量数据的处理方法及系统,包括:获取待显示海量数据的初始化参数;基于所述初始化参数分别计算得到全息图、全视差视点图、水平光场编码图和集成成像编码图;由所述全息图、所述全视差视点图、所述水平光场编码图和所述集成成像编码图获得显示编码图,通过检测所述显示编码图的交互得到所述待显示海量数据的三维显示结果。本发明所提出的三维显示海量数据处理方法可用于多种三维显示编码图,通过在图形处理器中并行处理,实现实时计算,根据初始参数来计算各视点位置以及各离轴相机光线方向,交互时仅需改变初始相机位置,便于实现交互等操作。
-
公开(公告)号:CN113095333A
公开(公告)日:2021-07-09
申请号:CN202110214381.3
申请日:2021-02-25
Applicant: 北京邮电大学
Abstract: 本发明提供一种无监督特征点检测方法及装置,该方法包括:利用编码器网络对训练图像提取特征,得到K个通道的特征图,归一化后生成特征点位置概率分布图;对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络;基于训练后的编码器网络,确定待检测图像的K个特征点位置。该方法无需手工标注特征点位置来进行有监督学习,可有效避免人工标注的人力成本和人工标注带来的主观错误,同时能够提高检测效率。
-
公开(公告)号:CN111812956B
公开(公告)日:2021-07-06
申请号:CN202010538138.2
申请日:2020-06-12
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种基于体数据的计算全息图生成方法、装置和电子设备,该方法包括读入待全息物体的体数据并设置用于将体数据中体素标量值转换为四元量的传递函数,使用反向光线投射算法,获取每条与待全息物体模型相交的光线的合成物点确定全息面的相位值和合成物点确定全息面的振幅值,然后基于所有与待全息物体模型相交的光线的合成物点信息来计算全息面的复振幅分布,进而生成待全息物体的全息图。本发明实施例提供的方法、装置和电子设备,实现了利用计算机图形学的优势采用计算机计算全息图生成,避免了传统全息技术需要严格的光学记录条件和较高的制备条件,且在全息图显示时灵活选定感兴趣区域。
-
公开(公告)号:CN112926596A
公开(公告)日:2021-06-08
申请号:CN202110185464.4
申请日:2021-02-10
Applicant: 北京邮电大学
Abstract: 本发明提供一种基于循环神经网络的实时超像素分割方法及系统,该方法包括:提取输入图像的特征,并对所述图像进行超像素关联图初始化;基于预设训练好的循环神经网络,对所述输入图像进行实时超像素分割,所述循环神经网络的输入是由超像素关联图初始化提取的初始输入和初始隐向量确定。本发明结合深度神经网络在特征提取和计算速度方面的优势,以及传统K‑means迭代聚类方法在超像素分割任务上的有效性和简单性,实现了实时超像素分割。
-
公开(公告)号:CN111813470A
公开(公告)日:2020-10-23
申请号:CN202010537425.1
申请日:2020-06-12
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种初始交互界面优化方法及装置,该方法包括:获取交互界面目标区域,对交互界面目标区域进行视觉显著性优化,得到视觉增强交互界面;将所述视觉增强交互界面中的文本内容进行潜在语义分析,并根据潜在语义分析结果对文本内容分组优化,得到分组后的文本内容,根据分组后的文本内容对视觉增强交互界面进行优化,得到优化后的初始交互界面。通过以不同的背景颜色呈现目标区域,其能够显著的吸引用户的注视,并且同步将文本内容进行分组优化,将相似度高的文本分为一组,有效减少对该组中的所有文本进行搜索的时间,最终减少了初学者用户对于初始交互界面的认识负荷,提高了认识成功率,有效改善了初学者用户的体验。
-
公开(公告)号:CN108377383B
公开(公告)日:2020-01-10
申请号:CN201610976374.6
申请日:2016-11-07
Applicant: 北京邮电大学
IPC: H04N13/363 , H04N13/324 , H04N9/31
Abstract: 本发明的一种多投影3D系统光场对比度调整方法及其系统,通过建立针对多投影3D系统的显示模型,并获取参考光场亮度的感知度和融合光场亮度的感知度,利用对比度差异衡量函数,计算出融合光场和目标光场的对比度最小值,再依据最优色调映射曲线,调整融合光场亮度图序列。从而提高3D显示屏显示的光场对比度,避免3D显示过程中反射光对3D显示效果的影响,提高其3D图像的显示效果。
-
-
-
-
-
-
-
-
-