-
公开(公告)号:CN114386569A
公开(公告)日:2022-04-22
申请号:CN202111572920.7
申请日:2021-12-21
Applicant: 大连理工大学
Abstract: 一种使用胶囊网络的新型图像描述生成算法,首先使用具有多通道的双线性池化注意模块处理区域级图像特征,通过双线性池化注意力机制和挤压—奖励操作对区域级特征进行处理,得到多通道注意的视觉特征;然后,将多通道特征输入到胶囊网络中,将区域级特征的每一维度作为一个底层胶囊中的活动向量,通过动态路由计算将区域级特征聚合为全局级图像特征;最后,解码使用LSTM的隐藏层向量、图像特征和上一时刻生成的单词词向量作为下一时刻的输入,同时使用双线性池化算法对特征和隐藏层状态进行更新,从而生成对应单词。经过多层LSTM,生成的多个单词组成对应的描述。本发明实现了使用胶囊网络在图像描述生成过程中捕捉相对位置关系并生成了更好的图像描述。