-
公开(公告)号:CN116686042A
公开(公告)日:2023-09-01
申请号:CN202180084626.3
申请日:2021-10-13
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L13/02
Abstract: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16),包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
公开(公告)号:CN116648742A
公开(公告)日:2023-08-25
申请号:CN202180084618.9
申请日:2021-10-13
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L13/02
Abstract: 公开了用于生成音频信号和训练音频发生器的技术。音频发生器(10)可以从表示音频信号(16)的目标数据(12)和输入信号(14)生成音频信号(16)。目标数据(12)从文本得出。音频发生器包括:第一处理块(40,50,50a‑50h),接收从输入信号(14)得出的第一数据(15,59a)并输出第一输出数据(69);第二处理块(45),作为第二数据接收第一输出数据(69)或从第一输出数据(69)得出的数据。第一处理块(50)包括:可学习层(71,72,73)的条件集,被配置为处理目标数据(12)以获得条件特征参数(74,75);以及样式元件(77),被配置为将条件特征参数(74,75)应用于第一数据(15,59a)或归一化的第一数据(59,76')。
-
公开(公告)号:CN117546237A
公开(公告)日:2024-02-09
申请号:CN202180098890.2
申请日:2021-08-06
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L25/30 , G10L25/18 , G10L25/24 , G10L21/0208
Abstract: 公开了用于解码和/或生成音频信号以及训练音频解码器和/或生成器的技术。一种音频解码器(10),其被配置成从比特流(3)生成音频信号(16),比特流(3)表示音频信号(16),音频信号被细分为帧序列。音频解码器(10)包括:第一数据供应器(702),用于提供第一数据(15),第一数据(15)具有多个通道;第一处理块(40、50、50a‑50h),用于输出具有多个通道(47)的第一输出数据(69),以及第二处理块(45)。第一处理块(50)包括:可学习层(710),用于接收比特流(3),并且对于给定帧,利用针对给定帧的多个通道和多个样本输出表示给定帧中的音频信号(16)的目标数据(12);调节可学习层(71、72、73),用于处理目标数据(12)以获得给定帧的调节特征参数(74、75);以及样式元素(77),其将调节特征参数(74、75)应用于第一数据(15、59a)。第二处理块(45)组合第二数据(69)的多个通道(47)以获得音频信号(16)。
-
-