-
公开(公告)号:CN117216225B
公开(公告)日:2024-06-04
申请号:CN202311358365.7
申请日:2023-10-19
Applicant: 四川大学 , 中国电子科技集团公司第十研究所 , 中国科学院光电技术研究所
IPC: G06F16/332 , G06F16/33 , G06N3/0495 , G06N3/08
Abstract: 本发明公开了一种基于三模态知识蒸馏的3D视觉问答方法,涉及视觉问答技术领域,首先构建三维视觉网络;基于三模态知识蒸馏,通过自我监督范式从基础性视觉‑语言神经网络中蒸馏出先验知识,训练三维视觉网络;将待进行3D视觉问答的三维点云数据以及问题输入训练好的三维视觉网络中,得到与问题对应的三维点云的场景特征以及三维点云中不同物体的视觉特征;将三维点云的场景特征、三维点云中不同物体的视觉特征、问题的语言特征输入Transformer‑Decoder中获取正确答案。本发明弥补了场景‑水平的点云‑文本信息的匮乏,使物体水平的三维点云‑二维图像特征和三维点云‑文本特征的蒸馏得以实现,问答准确率更高。
-
公开(公告)号:CN117274388B
公开(公告)日:2024-04-12
申请号:CN202311339921.6
申请日:2023-10-17
Applicant: 四川大学 , 中国科学院光电技术研究所
IPC: G06T7/73 , G06V10/80 , G06V10/82 , G06V10/774 , G06V10/764 , G06N3/088
Abstract: 本发明公开了基于视觉文本关系对齐的无监督三维视觉定位方法及系统,涉及三维视觉定位技术领域。包括:S1.获取图像步骤;S2.获取点云特征步骤;S3.生成实例分割掩码步骤;S4.获取关系感知图像特征步骤;S5.输出目标建议点步骤;S6.获取三维视觉定位框步骤;S7.获取训练模型步骤;S8.视觉定位预测步骤。本发明利用二维图像‑文本对比预训练模型中图像与文本特征空间的对齐关系,用图像特征代替文本特征,与三维点云进行融合匹配,实现无需文本标注的任务学习;再通过显式的空间关系感知,借助二维空间关系感知和三维场景图建模伪文本特征与点云中复杂空间关系,保证模型具备对伪文本和点云中复杂空间关系的理解能力。
-
公开(公告)号:CN117274388A
公开(公告)日:2023-12-22
申请号:CN202311339921.6
申请日:2023-10-17
Applicant: 四川大学 , 中国科学院光电技术研究所
IPC: G06T7/73 , G06V10/80 , G06V10/82 , G06V10/774 , G06V10/764 , G06N3/088
Abstract: 本发明公开了基于视觉文本关系对齐的无监督三维视觉定位方法及系统,涉及三维视觉定位技术领域。包括:S1.获取图像步骤;S2.获取点云特征步骤;S3.生成实例分割掩码步骤;S4.获取关系感知图像特征步骤;S5.输出目标建议点步骤;S6.获取三维视觉定位框步骤;S7.获取训练模型步骤;S8.视觉定位预测步骤。本发明利用二维图像‑文本对比预训练模型中图像与文本特征空间的对齐关系,用图像特征代替文本特征,与三维点云进行融合匹配,实现无需文本标注的任务学习;再通过显式的空间关系感知,借助二维空间关系感知和三维场景图建模伪文本特征与点云中复杂空间关系,保证模型具备对伪文本和点云中复杂空间关系的理解能力。
-
公开(公告)号:CN119828336A
公开(公告)日:2025-04-15
申请号:CN202510028716.0
申请日:2025-01-08
Applicant: 中国科学院光电技术研究所
Abstract: 本发明公开了一种基于大气照明后向散射光实现多孔径共轴的装置及方法,装置包括:激光器、发射孔径、探测孔径和成像系统;激光器发射的脉冲激光进入发射孔径后经过单孔径望远镜,由光束偏转扫描器件调整发射方向后射入大气;探测孔径负责接收指定距离处的大气照明后向散射光与接收目标上反射回来的目标反射光;来自探测孔径的大气照明后向散射光进入成像系统后,被会聚透镜会聚进入成像相机,在成像相机的靶面形成聚焦光斑,根据成像相机聚焦光斑的位置,由算法调整探测孔径的多孔径望远镜光轴精细调节器件,直到所有聚焦光斑重合,实现探测孔径的共轴。本发明技术方案,结构简单、成本低廉、易于实现。
-
公开(公告)号:CN118795677A
公开(公告)日:2024-10-18
申请号:CN202411093352.6
申请日:2024-08-09
Applicant: 中国科学院光电技术研究所
Abstract: 本发明涉及一种柱对称矢量光束产生方法及装置。利用激光器、起偏器、扩束镜、偏振方向旋转器、双自由曲面光束整形系统、相位调控器件以及由分束镜、光束旋转器、两块反射镜、相位补偿装置及合束镜构成的马赫曾德干涉仪光路结构产生柱对称矢量光束。激光器输出的光束经过起偏器后为线偏振光,通过扩束镜后,调整偏振方向,接着光束通过光束整形系统后整形为TEM10模高斯光束并且通过相位调控器件使得两瓣光斑的偏振方向相反,即两瓣光斑相位差为π,之后,利用马赫曾德干涉仪光路结构将光束分束并分别调控,其中一条支路成为TEM01模高斯光束,另一支路利用相位补偿装置调节光束的相位,使两路光束共相,最后两束光合束为径向或角向偏振光。
-
公开(公告)号:CN117216225A
公开(公告)日:2023-12-12
申请号:CN202311358365.7
申请日:2023-10-19
Applicant: 四川大学 , 中国电子科技集团公司第十研究所 , 中国科学院光电技术研究所
IPC: G06F16/332 , G06F16/33 , G06N3/0495 , G06N3/08
Abstract: 本发明公开了一种基于三模态知识蒸馏的3D视觉问答方法,涉及视觉问答技术领域,首先构建三维视觉网络;基于三模态知识蒸馏,通过自我监督范式从基础性视觉‑语言神经网络中蒸馏出先验知识,训练三维视觉网络;将待进行3D视觉问答的三维点云数据以及问题输入训练好的三维视觉网络中,得到与问题对应的三维点云的场景特征以及三维点云中不同物体的视觉特征;将三维点云的场景特征、三维点云中不同物体的视觉特征、问题的语言特征输入Transformer‑Decoder中获取正确答案。本发明弥补了场景‑水平的点云‑文本信息的匮乏,使物体水平的三维点云‑二维图像特征和三维点云‑文本特征的蒸馏得以实现,问答准确率更高。
-
公开(公告)号:CN114859565B
公开(公告)日:2023-06-13
申请号:CN202210633512.6
申请日:2022-06-07
Applicant: 中国科学院光电技术研究所
Abstract: 本发明涉及一种同轴反射式激光光束整形方法及装置,可用于将激光器输出光束的光强整形为所需要的环形分布,并能够有效补偿光强整形所产生的相位变化。本发明采用两片非球面反射镜,第一块非球面反射镜实现入射激光光束的能量发散光强整形,使得反射光在第二块非球面反射镜处实现所需要均匀平顶光的能量分布;第二块非球面反射镜负责对光束进行准直和相位补偿,使得输出的光束不仅为平顶光束,还具有近衍射极限的相位分布。本发明是集光束整形、光束准直和相位校正于一体的,具有结构紧凑、抗损伤阈值高、整形均匀化效果好等特点,应用前景广泛。
-
公开(公告)号:CN114859565A
公开(公告)日:2022-08-05
申请号:CN202210633512.6
申请日:2022-06-07
Applicant: 中国科学院光电技术研究所
Abstract: 本发明涉及一种同轴反射式激光光束整形方法及装置,可用于将激光器输出光束的光强整形为所需要的环形分布,并能够有效补偿光强整形所产生的相位变化。本发明采用两片非球面反射镜,第一块非球面反射镜实现入射激光光束的能量发散光强整形,使得反射光在第二块非球面反射镜处实现所需要均匀平顶光的能量分布;第二块非球面反射镜负责对光束进行准直和相位补偿,使得输出的光束不仅为平顶光束,还具有近衍射极限的相位分布。本发明是集光束整形、光束准直和相位校正于一体的,具有结构紧凑、抗损伤阈值高、整形均匀化效果好等特点,应用前景广泛。
-
-
-
-
-
-
-