一种跨模态的视频情感定位方法及装置

    公开(公告)号:CN117423023A

    公开(公告)日:2024-01-19

    申请号:CN202210812021.8

    申请日:2022-07-11

    Abstract: 一种视频情感定位方法及装置,涉及AI技术领域。该方法中包括:将待处理的视频划分为多个片段,以及获取各个片段的视频特征、及各个片段对应的字幕的字幕特征,然后根据各个片段的视频特征和各个片段对应的字幕的字幕特征,利用情感识别模型获得各个片段对应各个情感的概率,最后根据各个片段对应各个情感的概率,确定各个情感在该视频中对应的片段。该方法中情感识别模型融合片段的视频特征和片段对应的字幕特征进行情感识别,可以通过视频和字幕之间固有的语义一致性提高情感识别的准确性。

Patent Agency Ranking