模型训练的方法、装置及相关设备

    公开(公告)号:CN117828340A

    公开(公告)日:2024-04-05

    申请号:CN202211181895.4

    申请日:2022-09-27

    Abstract: 本申请提供了一种模型训练的方法,用于提高多模态识别模型的泛用性。其中,模型训练方法包括:获取第一训练数据集,所述第一训练数据集包括多组用于描述第一类对象的多模态数据;基于第一模型和所述第一训练数据集确定第一参数,所述第一模型用于对不同模态数据进行相似度识别,所述第一参数根据所述第一模型对不同的所述第一类对象的不同模态数据之间的相似度识别结果确定;根据所述第一参数和所述第一训练数据集训练所述第一模型,得到第二模型,所述第二模型用于对所述第一类对象的不同模态数据进行相似度识别。另外,本申请还提供了对应的装置、计算设备集群、芯片、计算机可读存储介质以及计算机程序产品。

    一种跨模态的视频情感定位方法及装置

    公开(公告)号:CN117423023A

    公开(公告)日:2024-01-19

    申请号:CN202210812021.8

    申请日:2022-07-11

    Abstract: 一种视频情感定位方法及装置,涉及AI技术领域。该方法中包括:将待处理的视频划分为多个片段,以及获取各个片段的视频特征、及各个片段对应的字幕的字幕特征,然后根据各个片段的视频特征和各个片段对应的字幕的字幕特征,利用情感识别模型获得各个片段对应各个情感的概率,最后根据各个片段对应各个情感的概率,确定各个情感在该视频中对应的片段。该方法中情感识别模型融合片段的视频特征和片段对应的字幕特征进行情感识别,可以通过视频和字幕之间固有的语义一致性提高情感识别的准确性。

Patent Agency Ranking