-
公开(公告)号:CN111771213B
公开(公告)日:2021-10-08
申请号:CN201980013180.8
申请日:2019-02-14
Applicant: 杜比实验室特许公司
IPC: G06N3/04 , G06N3/08 , G10L13/033
Abstract: 提供用于语音合成的计算机实施方法。语音合成器可经训练以产生经合成音频数据,所述经合成音频数据对应于源说话者根据目标说话者的语音特性说出的话语。可通过带时间戳的音位序列、音调曲线数据及说话者识别数据来训练所述语音合成器。所述语音合成器可包含话音建模神经网络及调节神经网络。
-
公开(公告)号:CN113748426A
公开(公告)日:2021-12-03
申请号:CN202080031250.5
申请日:2020-04-20
Applicant: 杜比实验室特许公司
IPC: G06K9/00 , H04N19/10 , H04N19/102 , H04N19/169 , H04N19/46 , H04N21/83 , H04N21/84 , H04H60/73 , G06T5/00
Abstract: 一种图像处理系统包括:输入端,其被配置为接收图像信号,该图像信号包括图像数据的多个帧;以及处理器,其被配置为基于所述多个帧中的至少一个帧来自动地确定图像分类、以及基于图像分类来动态地生成映射元数据。处理器包括:确定电路系统,其被配置为确定图像信号的内容类型;分割电路系统,其被配置为基于内容类型将图像数据分割成多个特征项区域;提取电路系统,其被配置为提取所述多个特征项区域中的相应各个特征项区域的至少一个图像方面值。
-
公开(公告)号:CN109478400B
公开(公告)日:2023-07-07
申请号:CN201780045266.X
申请日:2017-07-20
Abstract: 本发明揭示用于现场表演的多媒体内容的基于网络的处理及分布的方法、系统及计算机程序产品。在一些实施方案中,录制装置可经配置以录制多媒体事件(例如,音乐表演)。所述录制装置可在所述事件正在进行时将所述录制提供到服务器。所述服务器对所述录制进行自动同步、混音及母带处理。所述服务器使用先前在排练期间所捕获的参考音频数据执行所述自动混音及母带处理。所述服务器通过因特网或者其它公用或专用网络将所述经母带处理的录制流式传输到多个终端用户。所述流式传输可为现场流式传输。
-
公开(公告)号:CN113748426B
公开(公告)日:2023-06-09
申请号:CN202080031250.5
申请日:2020-04-20
Applicant: 杜比实验室特许公司
IPC: G06V20/40 , G06V10/60 , G06V10/26 , G06V10/764 , H04N19/10 , H04N19/102 , H04N19/169 , H04N19/46 , H04N21/83 , H04N21/84 , H04H60/73 , G06T5/00
Abstract: 一种图像处理系统包括:输入端,其被配置为接收图像信号,该图像信号包括图像数据的多个帧;以及处理器,其被配置为基于所述多个帧中的至少一个帧来自动地确定图像分类、以及基于图像分类来动态地生成映射元数据。处理器包括:确定电路系统,其被配置为确定图像信号的内容类型;分割电路系统,其被配置为基于内容类型将图像数据分割成多个特征项区域;提取电路系统,其被配置为提取所述多个特征项区域中的相应各个特征项区域的至少一个图像方面值。
-
公开(公告)号:CN111771213A
公开(公告)日:2020-10-13
申请号:CN201980013180.8
申请日:2019-02-14
Applicant: 杜比实验室特许公司
IPC: G06N3/04 , G06N3/08 , G10L13/033
Abstract: 提供用于语音合成的计算机实施方法。语音合成器可经训练以产生经合成音频数据,所述经合成音频数据对应于源说话者根据目标说话者的语音特性说出的话语。可通过带时间戳的音位序列、音调曲线数据及说话者识别数据来训练所述语音合成器。所述语音合成器可包含话音建模神经网络及调节神经网络。
-
公开(公告)号:CN116612731A
公开(公告)日:2023-08-18
申请号:CN202310747017.2
申请日:2017-07-20
Abstract: 本发明揭示用于现场音乐表演的多媒体内容的基于网络的处理及分布的方法、系统及计算机程序产品。在一些实施方案中,录制装置可经配置以录制多媒体事件(例如,音乐表演)。所述录制装置可在所述事件正在进行时将所述录制提供到服务器。所述服务器对所述录制进行自动同步、混音及母带处理。所述服务器使用先前在排练期间所捕获的参考音频数据执行所述自动混音及母带处理。所述服务器通过因特网或者其它公用或专用网络将所述经母带处理的录制流式传输到多个终端用户。所述流式传输可为现场流式传输。
-
公开(公告)号:CN109478400A
公开(公告)日:2019-03-15
申请号:CN201780045266.X
申请日:2017-07-20
CPC classification number: H04N21/232 , G10H1/00 , G10H1/0058 , G10H1/368 , G10H1/44 , G10H1/46 , G10H7/00 , G10H2210/305 , G10H2220/455 , G10H2240/325 , H04H60/04 , H04N21/2187 , H04N21/233 , H04N21/234 , H04N21/4334
Abstract: 本发明揭示用于现场表演的多媒体内容的基于网络的处理及分布的方法、系统及计算机程序产品。在一些实施方案中,录制装置可经配置以录制多媒体事件(例如,音乐表演)。所述录制装置可在所述事件正在进行时将所述录制提供到服务器。所述服务器对所述录制进行自动同步、混音及母带处理。所述服务器使用先前在排练期间所捕获的参考音频数据执行所述自动混音及母带处理。所述服务器通过因特网或者其它公用或专用网络将所述经母带处理的录制流式传输到多个终端用户。所述流式传输可为现场流式传输。
-
-
-
-
-
-