-
公开(公告)号:CN112703495A
公开(公告)日:2021-04-23
申请号:CN201980060346.1
申请日:2019-06-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/483 , G06F16/683 , G06F16/783
Abstract: 公开了用于从包含音频和视频两者的文件(例如,多模态文件或多媒体文件)推断主题以便促进视频索引的系统和方法。一组实体从文件中被提取,并且被链接以生成图;以及还获取该一组实体的参考信息。例如,可以从Wikipedia类别或其他大型本体数据源中抽取实体。使用无监督学习对图进行分析准许确定图中的簇。可以使用有监督学习从簇中提取特征提供了对主题标识符的选择。然后,主题标识符被用于对文件进行索引。
-
公开(公告)号:CN114287005A
公开(公告)日:2022-04-05
申请号:CN202080058773.9
申请日:2020-06-17
Applicant: 微软技术许可有限责任公司
Inventor: O·尼尔 , M·宗塔克 , T·C·伯恩斯 , A·辛格哈尔 , 张磊 , I·奥弗 , A·勒维 , H·萨博 , I·巴尔-梅纳凯姆 , E·亚米 , E·本托夫 , A·扎曼
IPC: G06K9/62 , G06V20/40 , G06V10/25 , G06V10/764 , G06V10/774
Abstract: 本文描述的技术针对用于索引视频的系统、方法和软件。在实施方式中,方法包括标识视频帧中的目标内容周围的一个或多个感兴趣区域。此外,该方法包括在感兴趣区域之外的帧的一部分中标识与感兴趣区域相邻的潜在空区域。该方法继续标识潜在空区域中的满足一个或多个标准的至少一个空区域,并将该至少一个空区域分类为目标内容的负样本。在一些实施方式中,目标内容的负样本位于目标内容的负样本集中,利用该负样本来训练用于标识目标内容的实例的机器学习模型。
-