视觉自注意力模型的训练方法
    1.
    发明公开

    公开(公告)号:CN117994607A

    公开(公告)日:2024-05-07

    申请号:CN202410130601.8

    申请日:2024-01-30

    Abstract: 本发明公开了一种视觉自注意力模型的训练方法,通过在视觉自注意力模型的主干网络中添加通道注意力机制;训练视觉自注意力模型,包括:获取多个训练样本;将当前训练样本中的输入样本输入至视觉自注意力模型中,确定多个特征向量;为多个特征向量拼接分类头向量以及可学习位置向量,得到待输入特征向量;将待输入特征向量输入至视觉编码器,得到待融合特征信息;基于多层感知机对待融合特征信息进行处理,得到预测结果;基于当前训练样本重复执行确定预测结果的次数达到预设次数阈值,将下一训练样本作为当前训练样本,直至视觉自注意力模型的准确率达到预设准确率阈值,提升了视觉自注意力模型对训练样本的学习能力,抑制模型的过拟合现象。

Patent Agency Ranking