一种基于Transformer的多模态情感分析方法

    公开(公告)号:CN118211175A

    公开(公告)日:2024-06-18

    申请号:CN202410272238.3

    申请日:2024-03-11

    Abstract: 本发明涉及一种基于Transformer的多模态情感分析方法。包括:S1、获取一组多模态,包括文本模态Ti、视觉模态Vi和音频模态Ai,将多模态进行联合嵌入处理;S2、单流Transformer模型的输出是H令牌,在H令牌中,H[CLS]利用at Pooler使用下游任务,Pooler使用全连接层和tanh激活功能,将Ti,V′i和A′i三对数据通过Pooler处理后,得到#imgabs0#S3、通过多模态掩码图像‑语言建模和图像文本对齐进行预训练任务;S4、对每组模态对的H[CLS]推导出的#imgabs1#和#imgabs2#施加自关注层和共同关注层,并送到全连接层进行结果预测;S5、用#imgabs3#代表联合损失函数,由S3中的两种预训练任务组成,#imgabs4#表示任务损失函数,目标函数由三个联合损失的平均值与#imgabs5#求和获得。本方法具有显著的优越性和有效性,将多模态预训练应用于情感分析具有发展潜力及应用价值。

Patent Agency Ranking