-
公开(公告)号:CN112703495A
公开(公告)日:2021-04-23
申请号:CN201980060346.1
申请日:2019-06-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/483 , G06F16/683 , G06F16/783
Abstract: 公开了用于从包含音频和视频两者的文件(例如,多模态文件或多媒体文件)推断主题以便促进视频索引的系统和方法。一组实体从文件中被提取,并且被链接以生成图;以及还获取该一组实体的参考信息。例如,可以从Wikipedia类别或其他大型本体数据源中抽取实体。使用无监督学习对图进行分析准许确定图中的簇。可以使用有监督学习从簇中提取特征提供了对主题标识符的选择。然后,主题标识符被用于对文件进行索引。