具有成对深度排序的视频重点检测

    公开(公告)号:CN108141645A

    公开(公告)日:2018-06-08

    申请号:CN201680061201.X

    申请日:2016-10-13

    Inventor: 姚霆 梅涛 芮勇

    Abstract: 描述了使用成对深度排序神经网络训练的视频重点检测。在一些示例中,视频中的重点被发现,然后用于生成视频(例如第一人称视频)的总结。采用成对深度排序模型来学习在先前识别的重点和非重点视频片段之间的关系。这种关系被封装在神经网络中。示例性的双流过程为用户视频的每个片段生成重点分数。将获得的重点分数用于总结用户视频的重点。

    精细化图像识别
    2.
    发明公开

    公开(公告)号:CN109284749A

    公开(公告)日:2019-01-29

    申请号:CN201710592777.5

    申请日:2017-07-19

    Inventor: 傅建龙 梅涛

    Abstract: 根据本公开的实现,提出了一种精细化图像识别的方案。在该方案中,利用第一学习网络的第一子网络提取图像的全局特征;利用第一学习网络的第二子网络、基于全局特征确定图像的第一关注区域,第一关注区域包括图像中对象的可辨识部分;利用第二学习网络的第一子网络提取第一关注区域的第一局部特征;以及至少部分基于第一局部特征确定图像中的对象的类别。通过该方案,实现了对于更精细尺度的图像区域的准确定位,从而可以获得基于精细尺度上的局部特征用于对象识别。

    通过内容检测、搜索和信息聚集来丰富在线视频

    公开(公告)号:CN102884538B

    公开(公告)日:2016-11-16

    申请号:CN201180020853.6

    申请日:2011-04-04

    Abstract: 许多因特网用户通过在线视频消费内容。例如,用户可观看电影、电视剧、音乐视频、和/或家庭自制视频。向消费在线视频的用户提供附加信息可能是有利的。遗憾的是,许多现有技术不能提供来自外部源的、与在线视频有关的附加信息。相应的,本文描述了用于确定与在线视频相关的一组附加信息的一个或多个系统和/或技术。具体来说,视觉的、文本的、音频、和/或其它特征可从在线视频中提取出来(例如,在线视频的原始内容和/或嵌入的广告)。使用提取出的特征,可基于将提取出的特征与数据库的内容进行匹配来确定附加信息(例如,图像、广告等)。附加信息可被呈现给消费在线视频的用户。

    空-时特征表示的提取
    5.
    发明授权

    公开(公告)号:CN109522902B

    公开(公告)日:2023-07-07

    申请号:CN201710841936.0

    申请日:2017-09-18

    Inventor: 姚霆 梅涛

    Abstract: 根据本公开的实现,提出了一种提取空‑时特征表示的方案。在该方案中,在学习网络的第一层处接收输入,该输入包括多个图像。利用第一层的第一单元在空间维度中从输入提取多个图像的第一特征,第一特征表征多个图像的空间呈现。基于第一单元与第一层中的第二单元之间的连接的类型,利用第二单元在时间维度中从第一特征和输入中的至少一个提取多个图像的第二特征,第二特征至少表征跨多个图像的时间变化。至少部分地基于第二特征来生成多个图像的空‑时特征表示。通过该方案,降低了学习网络的尺寸,提高了学习网络的训练和使用效率,同时还获得较准确的空‑时特征表示。

    空-时特征表示的提取
    6.
    发明公开

    公开(公告)号:CN109522902A

    公开(公告)日:2019-03-26

    申请号:CN201710841936.0

    申请日:2017-09-18

    Inventor: 姚霆 梅涛

    Abstract: 根据本公开的实现,提出了一种提取空-时特征表示的方案。在该方案中,在学习网络的第一层处接收输入,该输入包括多个图像。利用第一层的第一单元在空间维度中从输入提取多个图像的第一特征,第一特征表征多个图像的空间呈现。基于第一单元与第一层中的第二单元之间的连接的类型,利用第二单元在时间维度中从第一特征和输入中的至少一个提取多个图像的第二特征,第二特征至少表征跨多个图像的时间变化。至少部分地基于第二特征来生成多个图像的空-时特征表示。通过该方案,降低了学习网络的尺寸,提高了学习网络的训练和使用效率,同时还获得较准确的空-时特征表示。

Patent Agency Ranking