-
公开(公告)号:CN108141645A
公开(公告)日:2018-06-08
申请号:CN201680061201.X
申请日:2016-10-13
Applicant: 微软技术许可有限责任公司
IPC: H04N21/8549 , H04N21/4545 , H04N21/466
Abstract: 描述了使用成对深度排序神经网络训练的视频重点检测。在一些示例中,视频中的重点被发现,然后用于生成视频(例如第一人称视频)的总结。采用成对深度排序模型来学习在先前识别的重点和非重点视频片段之间的关系。这种关系被封装在神经网络中。示例性的双流过程为用户视频的每个片段生成重点分数。将获得的重点分数用于总结用户视频的重点。
-
公开(公告)号:CN109284749A
公开(公告)日:2019-01-29
申请号:CN201710592777.5
申请日:2017-07-19
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种精细化图像识别的方案。在该方案中,利用第一学习网络的第一子网络提取图像的全局特征;利用第一学习网络的第二子网络、基于全局特征确定图像的第一关注区域,第一关注区域包括图像中对象的可辨识部分;利用第二学习网络的第一子网络提取第一关注区域的第一局部特征;以及至少部分基于第一局部特征确定图像中的对象的类别。通过该方案,实现了对于更精细尺度的图像区域的准确定位,从而可以获得基于精细尺度上的局部特征用于对象识别。
-
公开(公告)号:CN107077487A
公开(公告)日:2017-08-18
申请号:CN201580056088.1
申请日:2015-10-07
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06K9/6256 , G06F16/51 , G06F16/583 , G06F16/5838 , G06K9/627
Abstract: 方便自动加标签的技术和构造可以提供图像存储和搜索中的改进。构造可以使得能够使用加标签的源图像和目标图像来训练深度网络。构造还可以使用个人照片本体来训练深度网络的顶层。构造还可以从本体中选择一个或多个概念以用于对个人数字图像加标签。
-
公开(公告)号:CN102884538B
公开(公告)日:2016-11-16
申请号:CN201180020853.6
申请日:2011-04-04
Applicant: 微软技术许可有限责任公司
IPC: G06K9/00
CPC classification number: G06K9/00751 , G06F17/30017 , G06F17/30828 , G06K9/00765 , G06Q30/02 , H04N21/4622 , H04N21/4722
Abstract: 许多因特网用户通过在线视频消费内容。例如,用户可观看电影、电视剧、音乐视频、和/或家庭自制视频。向消费在线视频的用户提供附加信息可能是有利的。遗憾的是,许多现有技术不能提供来自外部源的、与在线视频有关的附加信息。相应的,本文描述了用于确定与在线视频相关的一组附加信息的一个或多个系统和/或技术。具体来说,视觉的、文本的、音频、和/或其它特征可从在线视频中提取出来(例如,在线视频的原始内容和/或嵌入的广告)。使用提取出的特征,可基于将提取出的特征与数据库的内容进行匹配来确定附加信息(例如,图像、广告等)。附加信息可被呈现给消费在线视频的用户。
-
公开(公告)号:CN109522902B
公开(公告)日:2023-07-07
申请号:CN201710841936.0
申请日:2017-09-18
Applicant: 微软技术许可有限责任公司
IPC: G06V10/62 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 根据本公开的实现,提出了一种提取空‑时特征表示的方案。在该方案中,在学习网络的第一层处接收输入,该输入包括多个图像。利用第一层的第一单元在空间维度中从输入提取多个图像的第一特征,第一特征表征多个图像的空间呈现。基于第一单元与第一层中的第二单元之间的连接的类型,利用第二单元在时间维度中从第一特征和输入中的至少一个提取多个图像的第二特征,第二特征至少表征跨多个图像的时间变化。至少部分地基于第二特征来生成多个图像的空‑时特征表示。通过该方案,降低了学习网络的尺寸,提高了学习网络的训练和使用效率,同时还获得较准确的空‑时特征表示。
-
公开(公告)号:CN109522902A
公开(公告)日:2019-03-26
申请号:CN201710841936.0
申请日:2017-09-18
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种提取空-时特征表示的方案。在该方案中,在学习网络的第一层处接收输入,该输入包括多个图像。利用第一层的第一单元在空间维度中从输入提取多个图像的第一特征,第一特征表征多个图像的空间呈现。基于第一单元与第一层中的第二单元之间的连接的类型,利用第二单元在时间维度中从第一特征和输入中的至少一个提取多个图像的第二特征,第二特征至少表征跨多个图像的时间变化。至少部分地基于第二特征来生成多个图像的空-时特征表示。通过该方案,降低了学习网络的尺寸,提高了学习网络的训练和使用效率,同时还获得较准确的空-时特征表示。
-
-
-
-
-
-