-
公开(公告)号:CN117473332A
公开(公告)日:2024-01-30
申请号:CN202210848576.8
申请日:2022-07-19
Applicant: 华为云计算技术有限公司
IPC: G06F18/22 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V20/70 , G06V10/82 , G06F40/30 , G06F16/583 , G06F16/532 , G06F16/332 , G06F16/33 , G06V10/764
Abstract: 本申请实施例公开一种数据的处理方法以及相关设备,该方法可用于人工智能领域中,方法包括:获取第一图像中每个图像区域的特征信息,第一图像包括多个图像块,每个图像区域包括至少两个相邻的图像块;获取第一文本中每个对象描述信息的特征信息,对象描述信息包括对象的类别;根据每个图像区域的特征信息和每个对象描述信息的特征信息,通过第一神经网络生成第一指示信息,第一指示信息指示任意一个图像区域和任意一个对象描述信息之间的相似度。在图像区域和对象描述信息这一粒度计算特征信息之间的相似度,更能准确的反映图像区域和对象描述信息在语义上的相似度,进而有利于准确反映图像的语义和文本的语义之间的关系。
-
公开(公告)号:CN117423023A
公开(公告)日:2024-01-19
申请号:CN202210812021.8
申请日:2022-07-11
Applicant: 华为云计算技术有限公司
IPC: G06V20/40 , G06V20/62 , G06V30/262 , G06V30/19
Abstract: 一种视频情感定位方法及装置,涉及AI技术领域。该方法中包括:将待处理的视频划分为多个片段,以及获取各个片段的视频特征、及各个片段对应的字幕的字幕特征,然后根据各个片段的视频特征和各个片段对应的字幕的字幕特征,利用情感识别模型获得各个片段对应各个情感的概率,最后根据各个片段对应各个情感的概率,确定各个情感在该视频中对应的片段。该方法中情感识别模型融合片段的视频特征和片段对应的字幕特征进行情感识别,可以通过视频和字幕之间固有的语义一致性提高情感识别的准确性。
-