-
公开(公告)号:CN118235136A
公开(公告)日:2024-06-21
申请号:CN202280074414.1
申请日:2022-11-11
Applicant: 高通股份有限公司
IPC: G06N3/045 , G06N3/0464 , G06N3/084 , G06N3/096
Abstract: 本公开的某些方面提供了用于使用人工神经网络来处理视频内容的技术和装置。一种示例方法一般包括:接收至少包括第一帧和第二帧的视频数据流。使用教师神经网络从该第一帧提取第一特征。确定该第一帧与该第二帧之间的差异。使用学生神经网络从至少该第一帧与该第二帧之间的差异提取第二特征。基于该第一特征和该第二特征的求和来生成该第二帧的特征图。基于该第二帧的所生成特征图来生成针对该视频数据流的至少该第二帧的推断。
-
公开(公告)号:CN118233636A
公开(公告)日:2024-06-21
申请号:CN202410539252.5
申请日:2020-03-23
Applicant: 高通股份有限公司
IPC: H04N19/124 , H04N19/13 , H04N19/136 , H04N19/14 , H04N19/179 , H04N19/186 , H04N19/20 , H04N19/46 , H04N19/90 , H04N23/90 , G06N3/044 , G06N3/045 , G06N3/047 , G06N3/08 , G06N3/084 , G06T9/00 , H04N7/18
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。
-
公开(公告)号:CN116438545A
公开(公告)日:2023-07-14
申请号:CN202180075704.3
申请日:2021-11-16
Applicant: 高通股份有限公司
Inventor: B·艾特沙米·贝诺狄 , A·哈比比安 , F·M·波利克里 , A·歌德拉蒂
IPC: G06N3/084
Abstract: 本公开的某些方面提供了用于利用自动退出机器学习模型架构进行处理的技术,包括:在分类模型的第一部分中处理输入数据以生成第一中间激活数据;向第一门提供第一中间激活数据;由第一门作出关于是否要退出由该分类模型进行的处理的确定;以及从该分类模型的多个分类器之一生成分类结果。
-
-
公开(公告)号:CN113574882A
公开(公告)日:2021-10-29
申请号:CN202080020726.5
申请日:2020-03-19
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/08 , H04N19/136 , H04N19/90
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括接收用于压缩的视频内容。一般通过自编码器将所接收的视频内容编码到隐代码空间中,该自编码器可由第一人工神经网络来实现。一般通过经训练的概率模型(经训练的概率模型可由第二人工神经网络实现)来生成经编码视频内容的经压缩版本,并且输出以供传输。
-
公开(公告)号:CN108027834A
公开(公告)日:2018-05-11
申请号:CN201680054406.5
申请日:2016-08-03
Applicant: 高通股份有限公司
CPC classification number: G06F17/30823 , G06F17/30675 , G06F17/30799 , G06F17/3082 , G06K9/00664 , G06K9/00718 , G06K9/4628 , G06K9/6273 , G06N5/00 , G06N99/005
Abstract: 一种嵌入视频以供文本搜索的方法,包括从视频中提取视觉特征。视觉特征可例如包括外观信息、运动、音频和/或类似特征。词条向量由与视频相关联的文本描述确定。例如,文本可被包括在视频的标题中或被包括在视频内(例如,字幕)。基于所提取的视频特征计算特征投影,以及基于词条向量计算文本投影。通过联合优化语义可预测性和语义描述性,基于特征投影和文本投影来计算语义嵌入。
-
公开(公告)号:CN118251704A
公开(公告)日:2024-06-25
申请号:CN202280060174.X
申请日:2022-09-21
Applicant: 高通股份有限公司
Inventor: Y·李 , B·慕斯 , T·P·F·布兰克沃特 , A·哈比比安 , B·艾特沙米·贝诺狄
Abstract: 本公开的某些方面提供了用于使用机器学习模型处理视频流的技术和装置。一种示例方法一般包括从该视频流的第一帧生成第一令牌组以及从该视频流的第二帧生成第二令牌组。基于来自该第一令牌组的令牌与该第二令牌组中的对应令牌的比较,标识与来自该第一帧的要重用的特征相关联的第一令牌集以及与来自该第二帧的要计算的特征相关联的第二令牌集。生成针对该第二帧的对应于该第二令牌集的部分的特征输出。将与该第一令牌集相关联的特征与所生成特征输出组合成该第二帧的表示。
-
公开(公告)号:CN116457842A
公开(公告)日:2023-07-18
申请号:CN202180075566.9
申请日:2021-11-16
Applicant: 高通股份有限公司
Inventor: A·哈比比安 , D·阿巴蒂 , B·艾特沙米·贝诺狄
IPC: G06V10/82
Abstract: 一种用于经由人工神经网络进行视频处理的方法包括在该人工神经网络处接收视频流作为输入。基于该视频流的当前帧的第一特征与该视频流的先前帧的第二特征之间的差异来计算残差。基于该残差来处理该视频流的当前帧的一个或多个部分。附加地,基于该残差来跳过对视频的当前帧的一个或多个部分的处理。
-
公开(公告)号:CN111052151B
公开(公告)日:2023-07-11
申请号:CN201880056785.0
申请日:2018-10-05
Applicant: 高通股份有限公司
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06V10/25 , G06N3/0464 , G06N3/09
Abstract: 一种用于处理帧序列的方法包括接收该帧序列以及关于该帧序列的多个动作提议。该方法还包括生成该帧序列的表示,并围绕这些动作提议中的每一个动作提议对该表示进行池化。该方法进一步包括基于经池化表示来对这些动作提议进行分类,并基于该分类来控制设备。
-
公开(公告)号:CN113574883A
公开(公告)日:2021-10-29
申请号:CN202080020806.0
申请日:2020-03-23
Applicant: 高通股份有限公司
IPC: H04N19/13 , G06N3/08 , H04N19/20 , H04N19/136 , H04N19/90 , H04N19/186
Abstract: 本公开的某些方面涉及用于使用深度生成性模型来压缩视频内容的方法和装置。一种示例方法一般包括:接收供压缩的视频内容。所接收的视频内容一般通过可由第一人工神经网络实现的编码器被编码到隐性码空间中。经编码视频内容的经压缩版本一般通过可由第二人工神经网络实现的经训练概率性模型来生成并输出以供传输。
-
-
-
-
-
-
-
-
-