-
公开(公告)号:CN110826639A
公开(公告)日:2020-02-21
申请号:CN201911099506.1
申请日:2019-11-12
Applicant: 福州大学
IPC: G06K9/62
Abstract: 本发明涉及一种利用全量数据训练零样本图像分类方法,包括以下步骤:步骤S1:将全量数据分为源数据和目标数据;步骤S2:将源数据集和目标数据集输入视觉特征网络,将原始图像映射到视觉特征空间,得到图像视觉特征向量;步骤S3:将原始图像的低维属性语义通过语义转换网络映射到高维,得到语义特征向量;步骤S4:根据得到的图像视觉特征向量和语义特征向量,利用视觉-属性语义衔接网络完成融合,得到拼接结果;步骤S5:根据拼接结果,通过得分子网络在语义空间中产生原始图像每一类的得分,并根据得分输出最终的预测结果。本发明能够有效的解决图像类别标签缺失问题。
-
公开(公告)号:CN112328782B
公开(公告)日:2022-08-09
申请号:CN202011219386.7
申请日:2020-11-04
Applicant: 福州大学
Abstract: 本发明涉及一种融合图像过滤器的多模态摘要生成方法,包括步骤:获取输入文本的隐藏表示,得到文本上下文向量;提取输入图像的全局图像特征向量,并进行加权和计算得到图像上下文向量;对文本上下文向量与图像上下文向量进行融合,得到多模态信息的融合向量;采用图像过滤器来过滤图像中的噪声,选择最显著的图像特征,对图像上下文向量进行权重更新,并得到更新后的融合向量;采用单向的长短期记忆网络作为解码器,将更新后的融合向量解码得到最终的文本摘要。本发明从图像信息和文本信息融合出发,充分利用不同模态的信息提高文本摘要质量,并且能够应用于更大规模数据集应用场景。
-
公开(公告)号:CN110826639B
公开(公告)日:2023-05-12
申请号:CN201911099506.1
申请日:2019-11-12
Applicant: 福州大学
IPC: G06V10/764 , G06V10/774
Abstract: 本发明涉及一种利用全量数据训练零样本图像分类方法,包括以下步骤:步骤S1:将全量数据分为源数据和目标数据;步骤S2:将源数据集和目标数据集输入视觉特征网络,将原始图像映射到视觉特征空间,得到图像视觉特征向量;步骤S3:将原始图像的低维属性语义通过语义转换网络映射到高维,得到语义特征向量;步骤S4:根据得到的图像视觉特征向量和语义特征向量,利用视觉‑属性语义衔接网络完成融合,得到拼接结果;步骤S5:根据拼接结果,通过得分子网络在语义空间中产生原始图像每一类的得分,并根据得分输出最终的预测结果。本发明能够有效的解决图像类别标签缺失问题。
-
公开(公告)号:CN112328782A
公开(公告)日:2021-02-05
申请号:CN202011219386.7
申请日:2020-11-04
Applicant: 福州大学
Abstract: 本发明涉及一种融合图像过滤器的多模态摘要生成方法,包括步骤:获取输入文本的隐藏表示,得到文本上下文向量;提取输入图像的全局图像特征向量,并进行加权和计算得到图像上下文向量;对文本上下文向量与图像上下文向量进行融合,得到多模态信息的融合向量;采用图像过滤器来过滤图像中的噪声,选择最显著的图像特征,对图像上下文向量进行权重更新,并得到更新后的融合向量;采用单向的长短期记忆网络作为解码器,将更新后的融合向量解码得到最终的文本摘要。本发明从图像信息和文本信息融合出发,充分利用不同模态的信息提高文本摘要质量,并且能够应用于更大规模数据集应用场景。
-
-
-
-