一种无训练Transformer结构搜索方法

    公开(公告)号:CN114926319A

    公开(公告)日:2022-08-19

    申请号:CN202210673432.3

    申请日:2022-06-14

    Applicant: 厦门大学

    Abstract: 一种无训练Transformer结构搜索方法,涉及计算机视觉。在给定的ViT搜索空间中随机采样子模型结构作为基础结构集合,并对采样到的基础结构集合中的MSA和MLP模块进行模块化分析;依据MSA突触多样性评分和MLP突触显著性评分,计算基础结构集合中的各ViT模型结构的绩效指标TF‑indicator;将绩效指标TF‑indicator作为评估相应的ViT模型的代理分数,选取代理分数最高的模型结构交叉和变异,得新的子模型结构更新基础结构集合;循环迭代,选取基础结构集合代理分数最高的模型结构作为最终搜索结果。平衡搜索效率和搜索结果,提高TAS搜索效率,寻找相对最优ViT结构只需0.5个GPU天。

    一种基于对抗网络的单目深度估计系统实现方法

    公开(公告)号:CN110335299A

    公开(公告)日:2019-10-15

    申请号:CN201910349584.6

    申请日:2019-04-28

    Applicant: 厦门大学

    Inventor: 纪荣嵘 郭锋 李珂

    Abstract: 一种基于对抗网络的单目深度估计系统实现方法,涉及单目图像深度估计。包括训练阶段和测试,所述训练阶段的具体步骤为:收集用于训练的RGB图像集和前n张图像对应的深度图像集合;根据设计的网络结构初始化生成器网络参数θG和两个判别器网络的参数θPD,θDD;设置训练的迭代次数;所述测试阶段的具体步骤为:导入训练好的生成器网络权重;将一张图像作为输入传递给生成器网络;使用导入的网络权重对输入图像进行计算,网络输出输入图像中每个像素点对应的深度值信息。打破了主动深度感知硬件深度空洞和深度稀疏的瓶颈,并且保持了比较高的深度恢复精度,对场景重建、无人驾驶、增强现实等领域都有着重要的实用价值和意义。

    一种基于对抗网络的单目深度估计系统实现方法

    公开(公告)号:CN110335299B

    公开(公告)日:2021-08-13

    申请号:CN201910349584.6

    申请日:2019-04-28

    Applicant: 厦门大学

    Inventor: 纪荣嵘 郭锋 李珂

    Abstract: 一种基于对抗网络的单目深度估计系统实现方法,涉及单目图像深度估计。包括训练阶段和测试,所述训练阶段的具体步骤为:收集用于训练的RGB图像集和前n张图像对应的深度图像集合;根据设计的网络结构初始化生成器网络参数θG和两个判别器网络的参数θPD,θDD;设置训练的迭代次数;所述测试阶段的具体步骤为:导入训练好的生成器网络权重;将一张图像作为输入传递给生成器网络;使用导入的网络权重对输入图像进行计算,网络输出输入图像中每个像素点对应的深度值信息。打破了主动深度感知硬件深度空洞和深度稀疏的瓶颈,并且保持了比较高的深度恢复精度,对场景重建、无人驾驶、增强现实等领域都有着重要的实用价值和意义。

Patent Agency Ranking