-
公开(公告)号:CN106663210B
公开(公告)日:2021-08-20
申请号:CN201580035750.5
申请日:2015-06-24
Applicant: 杜比实验室特许公司
Abstract: 本文公开的示例实施例涉及基于感受的多媒体处理。公开了一种用于处理多媒体数据的方法,所述方法包括:基于多个类而自动地确定关于所述多媒体数据的片段的用户感受,所述多个类与预定义用户感受相关联地被获取;以及至少部分地基于所确定的关于所述片段的所述用户感受,处理所述多媒体数据的所述片段。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN104240711B
公开(公告)日:2019-10-11
申请号:CN201310246711.2
申请日:2013-06-18
Applicant: 杜比实验室特许公司
IPC: G10L19/008 , G10L21/038
Abstract: 本发明的实施例涉及自适应音频内容生成。具体而言,公开了一种用于生成自适应音频内容的方法,该方法包括:从基于声道的源音频内容中提取至少一个音频对象,以及至少部分地基于该至少一个音频对象生成自适应音频内容。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN102956237B
公开(公告)日:2016-12-07
申请号:CN201110243107.5
申请日:2011-08-19
Applicant: 杜比实验室特许公司
IPC: G10L25/00
CPC classification number: G10L25/51 , G10L19/038 , H04R29/00
Abstract: 描述了测量内容一致性的方法和设备。测量第一音频部分与第二音频部分之间的内容一致性。针对第一音频部分中的每个音频分段,确定第二音频部分中预定数目的音频分段。第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于该音频分段与第二音频部分中的所有其它音频分段之间的内容相似度。计算第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值。将内容一致性计算为,针对第一音频部分中的各音频分段而计算的各平均值的平均值、最大值或最小值。可以基于狄里克雷分布计算内容相似度。
-
公开(公告)号:CN105992120A
公开(公告)日:2016-10-05
申请号:CN201510066647.9
申请日:2015-02-09
Applicant: 杜比实验室特许公司
IPC: H04S7/00
Abstract: 本发明的实施例涉及音频信号的上混音。描述了一种对音频信号进行上混音的方法。该方法包括:将所述音频信号分解成扩散信号和直达信号;至少部分地基于扩散信号,生成音频静态环境声,音频静态环境声包括高度声道;从直达信号中提取音频对象;估计音频对象的元数据,元数据包括音频对象的高度信息;以及将音频静态环境声和音频对象呈现为经过上混音的音频信号,其中音频静态环境声被呈现到预定义的位置并且音频对象根据元数据而被呈现。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN105898667A
公开(公告)日:2016-08-24
申请号:CN201410814973.9
申请日:2014-12-22
Applicant: 杜比实验室特许公司
CPC classification number: G06K9/624 , G06F17/15 , H03H21/00 , H03H2021/0034 , H04S5/00 , H04S2400/03 , H04S2400/11
Abstract: 本发明的实施方式涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法。该方法包括标识第一投影空间集合,所述第一投影空间集合包括用于所述多个声道中的第一声道的第一子集和用于所述多个声道中的第二声道的第二子集。该方法可以进一步包括确定所述第一声道和所述第二声道之间的第一相关性集合,所述第一相关性集合中的每个相关性对应于所述第一投影空间子集中的一个投影空间和所述第二投影空间子集中的一个投影空间。另外,该方法可以包括至少部分地基于所述第一相关性集合中的第一相关性和来自所述第一子集的对应于所述第一相关性的投影空间来从所述第一声道的音频信号中提取音频对象,所述第一相关性大于第一预定义阈值。也公开了对应的系统和计算机程序产品。
-
公开(公告)号:CN104079247B
公开(公告)日:2018-02-09
申请号:CN201310100401.X
申请日:2013-03-26
Applicant: 杜比实验室特许公司
Abstract: 公开了均衡器控制器和控制方法以及音频再现设备。在一个实施方式中,均衡器控制器包括:音频分类器,用于实时地识别音频信号的音频类型;以及调整单元,用于基于所识别的音频类型的置信度值来以连续的方式调整均衡器,其中,音频分类器被配置成将音频信号分类到具有相应置信度值的多个音频类型中,并且调整单元被配置成通过基于多个音频类型的重要性对多个音频类型的置信度值进行加权来考虑多个音频类型中的至少一些音频类型。
-
公开(公告)号:CN102956237A
公开(公告)日:2013-03-06
申请号:CN201110243107.5
申请日:2011-08-19
Applicant: 杜比实验室特许公司
IPC: G10L25/00
CPC classification number: G10L25/51 , G10L19/038 , H04R29/00
Abstract: 描述了用于测量内容一致性的实施例和用于测量内容相似度的实施例。测量第一音频部分与第二音频部分之间的内容一致性。针对第一音频部分中的每个音频分段,确定第二音频部分中预定数目的音频分段。第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度高于该音频分段与第二音频部分中的所有其它音频分段之间的内容相似度。计算第一音频部分中的该音频分段与所确定的音频分段之间的内容相似度的平均值。将内容一致性计算为,针对第一音频部分中的各音频分段而计算的各平均值的平均值、最大值或最小值。可以基于狄里克雷分布计算内容相似度。
-
公开(公告)号:CN105874533B
公开(公告)日:2019-11-26
申请号:CN201480064848.9
申请日:2014-11-25
Applicant: 杜比实验室特许公司
IPC: G10L19/008
Abstract: 本发明的实施例涉及音频对象提取。公开了一种用于从音频内容中提取音频对象的方法,所述音频内容具有基于多个声道的格式,所述方法包括:至少部分地基于所述多个声道之间的频谱相似性,对所述音频内容的各帧应用音频对象提取;以及基于对所述各帧的所述音频对象提取,跨所述音频内容的帧执行音频对象合成,以生成至少一个音频对象的音轨。还公开了相应的系统和计算机程序产品。
-
公开(公告)号:CN107113526B
公开(公告)日:2019-09-24
申请号:CN201580070126.9
申请日:2015-12-18
Applicant: 杜比实验室特许公司
IPC: H04S5/00
Abstract: 公开了一种用于从音频内容中提取音频对象的方法。该方法包括标识第一投影空间集合,所述第一投影空间集合包括用于所述多个声道中的第一声道的第一子集和用于所述多个声道中的第二声道的第二子集。该方法可以进一步包括确定所述第一声道和所述第二声道之间的第一相关性集合,所述第一相关性集合中的每个相关性对应于所述第一投影空间子集中的一个投影空间和所述第二投影空间子集中的一个投影空间。另外,该方法可以包括至少部分地基于所述第一相关性集合中的第一相关性和来自所述第一子集的对应于所述第一相关性的投影空间来从所述第一声道的音频信号中提取音频对象,所述第一相关性大于第一预定义阈值。也公开了对应的系统和计算机程序产品。
-
公开(公告)号:CN107113526A
公开(公告)日:2017-08-29
申请号:CN201580070126.9
申请日:2015-12-18
Applicant: 杜比实验室特许公司
IPC: H04S5/00
Abstract: 公开了一种用于从音频内容中提取音频对象的方法。该方法包括标识第一投影空间集合,所述第一投影空间集合包括用于所述多个声道中的第一声道的第一子集和用于所述多个声道中的第二声道的第二子集。该方法可以进一步包括确定所述第一声道和所述第二声道之间的第一相关性集合,所述第一相关性集合中的每个相关性对应于所述第一投影空间子集中的一个投影空间和所述第二投影空间子集中的一个投影空间。另外,该方法可以包括至少部分地基于所述第一相关性集合中的第一相关性和来自所述第一子集的对应于所述第一相关性的投影空间来从所述第一声道的音频信号中提取音频对象,所述第一相关性大于第一预定义阈值。也公开了对应的系统和计算机程序产品。
-
-
-
-
-
-
-
-
-