一种基于动态语义图神经网络的视觉问答方法及系统

    公开(公告)号:CN116541507A

    公开(公告)日:2023-08-04

    申请号:CN202310820674.5

    申请日:2023-07-06

    Abstract: 本发明公开了一种基于动态语义图神经网络的视觉问答方法及系统,所述方法包括:构建包含Glove词嵌入模型、Bi‑GRU模型、双线性注意力模型、图注意网络模型和多层感知机模型的动态语义图神经网络模型;基于多个训练样本,对用于视觉问答预测的所述动态语义图神经网络模型进行训练,得到目标视觉问答模型;其中,每个训练样本包括:训练图像和该训练图像对应的训练问句文本;将目标图像和所述目标图像对应的待测问句文本输入至所述目标视觉问答模型中,得到目标视觉问答结果。本发明能够有效提升视觉问答模型的性能,并能够提升视觉问答的准确率。

Patent Agency Ranking