-
公开(公告)号:CN107820711B
公开(公告)日:2020-09-08
申请号:CN201680034882.0
申请日:2016-06-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 法比安·卡驰 , 克里斯蒂安·乌勒 , 迈克尔·卡拉舒曼 , 伯恩哈德·诺伊格鲍尔 , 迈克尔·迈耶
IPC: H04S3/00 , H04S7/00 , G10L19/008
Abstract: 一种用于处理音频信号(100)的音频处理器,包括:音频信号修改器(2),用于响应于用户输入(200)而修改所述音频信号(100);响度控制器(6),用于基于参考响度(Lref)或参考增益(gi)及经修改响度(Lmod)或经修改增益(hi)而确定响度补偿增益(C),其中所述经修改响度(Lmod)或所述经修改增益(hi)取决于所述用户输入;及响度操控器(5),用于使用所述响度补偿增益(C)操控信号(101)的响度。
-
公开(公告)号:CN107820711A
公开(公告)日:2018-03-20
申请号:CN201680034882.0
申请日:2016-06-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 法比安·卡驰 , 克里斯蒂安·乌勒 , 迈克尔·卡拉舒曼 , 伯恩哈德·诺伊格鲍尔 , 迈克尔·迈耶
IPC: H04S3/00 , H04S7/00 , G10L19/008
Abstract: 一种用于处理音频信号(100)的音频处理器,包括:音频信号修改器(2),用于响应于用户输入(200)而修改所述音频信号(100);响度控制器(6),用于基于参考响度(Lref)或参考增益(gi)及经修改响度(Lmod)或经修改增益(hi)而确定响度补偿增益(C),其中所述经修改响度(Lmod)或所述经修改增益(hi)取决于所述用户输入;及响度操控器(5),用于使用所述响度补偿增益(C)操控信号(101)的响度。
-
公开(公告)号:CN112074902B
公开(公告)日:2024-04-12
申请号:CN201980024782.3
申请日:2019-01-31
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L19/18 , G10L19/02
Abstract: 一种用于编码音频场景的音频场景编码器,音频场景包括至少两个分量信号,音频场景编码器包括:用于对至少两个分量信号进行核心编码的核心编码器(160),其中核心编码器(160)被配置用以针对至少两个分量信号的第一部分产生第一编码表示(310),并且用以针对至少两个分量信号的第二部分产生第二编码表示(320),用于分析音频场景以得出针对第二部分的一个或多个空间参数(330)或一个或多个空间参数集的空间分析器(200);以及用于形成经编码音频场景信号(340)的输出接口(300),经编码音频场景信号(340)包括第一编码表示(310)、针对第二部分的第二编码表示(320)及一个或多个空间参数(330)或一个或多个空间参数集。
-
公开(公告)号:CN120019380A
公开(公告)日:2025-05-16
申请号:CN202380069545.5
申请日:2023-09-21
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G06F40/35 , G06F40/216 , G06F40/284 , G06F40/289
Abstract: 提供了一种根据实施例的对话系统。对话系统包括:输入接口(105),用于通过接收输入并从输入得出输入表示、或通过接收输入表示,获得输入的输入表示,输入表示是音频信号表示或语音表示或文本表示,其中输入表示包括多个输入表示元素。此外,对话系统包括预处理器(110),用于对输入表示进行预处理以生成预处理信息,使得预处理信息包括多个预处理信息元素,以及使得多个预处理信息元素中的两个或更多个中的每个依赖于多个信息表示元素中的至少两个。此外,对话系统包括两个或更多个信息提取处理器(120,123),其中两个或更多个信息提取处理器(120,123)中的每个适用于根据特定于信息提取处理器并且与两个或更多个信息提取处理器(120,123)中的任何其他一个的信息提取规则不同的信息提取规则从预处理信息生成所得信息。此外,对话系统包括输出接口(135),用于依据来自两个或更多个信息提取处理器(120,123)中的一个或多个的所得信息,生成输出,输出是音频输出和/或文本输出和/或视觉输出和/或用于操纵机器的信号。
-
公开(公告)号:CN112074902A
公开(公告)日:2020-12-11
申请号:CN201980024782.3
申请日:2019-01-31
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L19/18 , G10L19/02
Abstract: 一种用于编码音频场景的音频场景编码器,音频场景包括至少两个分量信号,音频场景编码器包括:用于对至少两个分量信号进行核心编码的核心编码器(160),其中核心编码器(160)被配置用以针对至少两个分量信号的第一部分产生第一编码表示(310),并且用以针对至少两个分量信号的第二部分产生第二编码表示(320),用于分析音频场景以得出针对第二部分的一个或多个空间参数(330)或一个或多个空间参数集的空间分析器(200);以及用于形成经编码音频场景信号(340)的输出接口(300),经编码音频场景信号(340)包括第一编码表示(310)、针对第二部分的第二编码表示(320)及一个或多个空间参数(330)或一个或多个空间参数集。
-
公开(公告)号:CN118197326A
公开(公告)日:2024-06-14
申请号:CN202410317506.9
申请日:2019-01-31
Applicant: 弗劳恩霍夫应用研究促进协会
IPC: G10L19/008 , G10L19/18 , G10L19/02
Abstract: 一种用于编码音频场景的音频场景编码器,音频场景包括至少两个分量信号,音频场景编码器包括:用于对至少两个分量信号进行核心编码的核心编码器(160),其中核心编码器(160)被配置用以针对至少两个分量信号的第一部分产生第一编码表示(310),并且用以针对至少两个分量信号的第二部分产生第二编码表示(320),用于分析音频场景以得出针对第二部分的一个或多个空间参数(330)或一个或多个空间参数集的空间分析器(200);以及用于形成经编码音频场景信号(340)的输出接口(300),经编码音频场景信号(340)包括第一编码表示(310)、针对第二部分的第二编码表示(320)及一个或多个空间参数(330)或一个或多个空间参数集。
-
公开(公告)号:CN112291699B
公开(公告)日:2022-07-22
申请号:CN202010806373.3
申请日:2016-06-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 法比安·卡驰 , 克里斯蒂安·乌勒 , 迈克尔·卡拉舒曼 , 伯恩哈德·诺伊格鲍尔 , 迈克尔·迈耶
IPC: H04S3/00 , H04S7/00 , G10L19/008
Abstract: 一种用于处理音频信号(100)的音频处理器,包括:音频信号修改器(2),用于响应于用户输入(200)而修改所述音频信号(100);响度控制器(6),用于基于参考响度(Lref)或参考增益(gi)及经修改响度(Lmod)或经修改增益(hi)而确定响度补偿增益(C),其中所述经修改响度(Lmod)或所述经修改增益(hi)取决于所述用户输入;及响度操控器(5),用于使用所述响度补偿增益(C)操控信号(101)的响度。
-
公开(公告)号:CN112291699A
公开(公告)日:2021-01-29
申请号:CN202010806373.3
申请日:2016-06-09
Applicant: 弗劳恩霍夫应用研究促进协会
Inventor: 法比安·卡驰 , 克里斯蒂安·乌勒 , 迈克尔·卡拉舒曼 , 伯恩哈德·诺伊格鲍尔 , 迈克尔·迈耶
IPC: H04S3/00 , H04S7/00 , G10L19/008
Abstract: 一种用于处理音频信号(100)的音频处理器,包括:音频信号修改器(2),用于响应于用户输入(200)而修改所述音频信号(100);响度控制器(6),用于基于参考响度(Lref)或参考增益(gi)及经修改响度(Lmod)或经修改增益(hi)而确定响度补偿增益(C),其中所述经修改响度(Lmod)或所述经修改增益(hi)取决于所述用户输入;及响度操控器(5),用于使用所述响度补偿增益(C)操控信号(101)的响度。
-
-
-
-
-
-
-