一种基于语言大模型和视觉编码器的多模态网络谣言检测方法

    公开(公告)号:CN117763421A

    公开(公告)日:2024-03-26

    申请号:CN202311792049.0

    申请日:2023-12-25

    Applicant: 福州大学

    Inventor: 柯逍 吴尚辉

    Abstract: 本发明提供一种基于语言大模型和视觉编码器的多模态网络谣言检测方法,首先获取网络谣言检测数据集,将其中所有图片通过光学字符识别模型提取为文本,然后把查询文本、证据文本、从图片中提取的文本分别输入语言大模型得到对应的文本特征序列向量,把查询图片、证据图片分别输入视觉编码器得到对应的图片特征向量。通过多头注意力机制,计算查询信息对证据信息的注意力分数,并将其作为权重重新计算证据信息。随后将每条文本特征序列按序列长度维度取其平均值作为代表信息,最后将图片特征向量、请查询本特征向量、证据文本特征向量拼接,输入多层感知机后得出分类结果。

Patent Agency Ranking