-
公开(公告)号:CN116030110A
公开(公告)日:2023-04-28
申请号:CN202310105817.4
申请日:2023-02-08
Applicant: 杭州电子科技大学
IPC: G06T7/557 , G06V10/82 , G06V10/80 , G06V10/764 , G06N3/0455 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种基于Transformer的光场极线几何图像视差估计方法。该方法设计了一种具有空间一致性信息保持的EpiFormer网络结构;该方法从0°、45°、90°、135°四个方向提取EPI图像块,并且每个方向提取三个相邻的EPI图像块,共12个EPI图像块作为EpiFormer网络结构的输入,输出为中心像素的视差值,通过把光场中心子光圈所有像素估计的视差值拼接起来,从而得到对应的光场视差图。本发明基于Transformer的方法,有效的建模EPI图像块中像素与像素之间的关联,同时添加了空间信息,缓解了遮挡带来的影响,同时也能得到更精确的像素匹配。
-
公开(公告)号:CN116152070A
公开(公告)日:2023-05-23
申请号:CN202310214716.0
申请日:2023-03-08
Applicant: 杭州电子科技大学
IPC: G06T3/40 , G06N3/0464
Abstract: 本发明公开了一种基于深度学习的光场视频时间‑角度超分辨率网络。本发明步骤如下:1、假设输入为低角度分辨率宏像素形式的光场图像以合成中间帧低角度分辨率的宏像素形式的光场图像为目标,设计时间超分辨率模块;2、对时间超分辨率模块的输出结果进行角度超分辨率运算,最终得到角度超分辨率运算后的宏像素形式的光场图像本发明设计了一种角度独立的通道注意力机制代替光流预测模块来更好地完成前后帧像素的过滤与融合。
-
公开(公告)号:CN116129089A
公开(公告)日:2023-05-16
申请号:CN202310198898.7
申请日:2023-03-03
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于计算机视觉的颅脑手术虚拟导航系统。本发明包括如下步骤:1:获取患者的面部三维可见光点云数据;2:获取患者的面部三维CT点云数据;3:采用可见光和CT点云配准方法,估计旋转和平移矩阵;4:基于棋盘格检测的颅钻追踪。本发明利用VTK框架和CT数据进行人的头颅的三维重建,然后获取模型脸部数据,再使用RGBD相机进行人脸识别,获取人脸点云数据,利用三维重建的的人脸数据与人脸识别获取的点云数据进行配准,解决病灶位置的坐标转换问题。针对颅钻在手术过程中的实时检测和导航,采用将棋盘格镶嵌在颅钻上,利用RGBD对其进行定位和实时追踪,以便准确的切除肿瘤从而完成开颅手术。本发明操作简单、评测精确、性能优良。
-
-