-
-
公开(公告)号:CN113016189B
公开(公告)日:2023-12-19
申请号:CN201980075358.1
申请日:2019-11-15
Applicant: 三星电子株式会社
IPC: H04N21/439 , H04N21/466 , G06N3/045 , G06N3/084 , G06N3/09 , G06N3/092 , G06N3/091
Abstract: 提供了一种识别音频场景的电子设备和方法。识别音频场景的方法包括:根据预定的标准,将输入音频信号分离为声道;根据每个分离的声道,通过使用被训练为识别音频场景的多个神经网络,从输入音频信号中识别至少一个音频场景;以及基于对至少一个音频场景的识别的结果,通过使用被训练为结合各个声道的音频场景识别结果的神经网络,确定音频内容中包括的至少一个音频场景,其中,多个神经网络包括:第一神经网络,被训练为基于音频信号的时频形状来识别音频场景;第二神经网络,被训练为基于音频信号的频谱包络的形状来识别音频场景;以及第三神经网络,被训练为基于从音频信号中提取(56)对比文件US 9153231 B1,2015.10.06WO 2016148825 A1,2016.09.22CN 105720939 A,2016.06.29WO 2018162803 A1,2018.09.13US 2015120291 A1,2015.04.30CN 106469552 A,2017.03.01US 2017061966 A1,2017.03.02KR 20170124854 A,2017.11.13US 2018063662 A1,2018.03.01Yoonchang Han等.CONVOLUTIONAL NEURALNETWORKS WITH BINAURAL REPRESENTATIONSAND BACKGROUND SUBTRACTION FOR ACOUSTICSCENE CLASSIFICATION《.DETECTION ANDCLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2017》.2017,Sharath Adavanne.SOUND EVENTDETECTION IN MULTICHANNEL AUDIO USINGSPATIAL AND HARMONIC FEATURES《.DETECTIONAND CLASSIFICATION OR ACOUSTIC SCENES ANDEVENTS 2016》.2016,Weiping Zheng等.CNNs-based AcousticScene Classification using Multi-Spectrogram Fusion and Label Expansions.《JOURNAL OF LATEX CLASS FILES》.2015,
-
公开(公告)号:CN108834038B
公开(公告)日:2021-08-03
申请号:CN201810662693.9
申请日:2015-03-30
Applicant: 三星电子株式会社
IPC: H04S7/00
Abstract: 提供了一种用于渲染声学信号的方法和设备。当多声道信号(诸如来自22.2声道的多声道信号)被渲染到5.1声道时,三维音频信号可通过二维输出声道的方法被再现,但是,当输入声道的高度与标准高度不同并且使用与标准高度相应的高度渲染参数时,发生音频图像失真。根据本发明的实施例的对音频信号进行渲染的方法包括以下步骤:接收包括将被转换为多个输出声道的多个输入声道的多声道信号;获得用于具有标准仰角的上方输入声道的高度渲染参数使得每个输出声道提供具有高度感的音频图像;对用于具有设置的仰角而不是标准仰角的上方输入声道的高度渲染参数进行更新,其中,即使在输入声道的高度不同于标准高度时,所述方法也可减少音频图像失真。
-
公开(公告)号:CN110213709B
公开(公告)日:2021-06-15
申请号:CN201910547164.9
申请日:2015-06-26
Applicant: 三星电子株式会社
Abstract: 本发明的实施方式提供了用于渲染声学信号的方法和设备及计算机可读记录介质,该方法包括:接收包括要转换成多个输出声道的多个输入声道的多声道信号;对前高处输入声道添加预定延迟以允许多个输出声道中的每一个以参考高角度提供具有高度的声像;基于所添加的延迟,改变对于前高处输入声道的高度渲染参数;以及通过基于所改变的高度渲染参数生成相对于前高处输入声道延迟的经高度渲染的环绕输出声道来防止前后混淆。
-
公开(公告)号:CN107430860B
公开(公告)日:2021-04-30
申请号:CN201680010203.6
申请日:2016-02-15
Applicant: 三星电子株式会社
Abstract: 根据本发明的实施例的为解决其技术问题而对音频进行解码的方法包括如下步骤:接收由音频包形成的比特流;对接收到的比特流中所包括的音频包进行解码;提取解码的包的类型;从系统元数据对应于提取的解码的包的类型的包获得系统数据;将获得的系统数据传送给系统引擎,其中,系统数据包括以下项中的至少一项:与系统引擎的类型有关的信息以及与系统数据的长度有关的信息。
-
公开(公告)号:CN106463124B
公开(公告)日:2021-03-30
申请号:CN201580027499.8
申请日:2015-03-24
Applicant: 三星电子株式会社
IPC: G10L19/008
Abstract: 在将多声道信号诸如22.2声道信号渲染为5.1声道信号的情况下,可以使用二维(2D)输出声道来再现三维(3D)音频信号,但是已渲染的音频信号敏感地受扬声器布局的影响并且当所布置扬声器的布局不同于标准布局时可导致声像失真。本发明可以解决本文提到的现有技术的问题。根据本发明的一个实施方案,用于即使在所布置扬声器的布局不同于标准布局时减少声像失真的音频信号渲染方法包括:接收包括待转换成多个输出声道的多个输入声道的多声道信号;根据扬声器的位置和与多个输出声道中的每一个相对应的标准位置来获取关于至少一个输出声道的偏差信息;以及基于所获取的偏差信息,修改从包括在多个输入声道中的高度声道到具有偏差信息的输出声道的平移增益。
-
公开(公告)号:CN107787584B
公开(公告)日:2020-07-24
申请号:CN201680035700.1
申请日:2016-06-17
Applicant: 三星电子株式会社
IPC: H04N21/233 , H04N21/439 , G10L19/008
Abstract: 根据用于实现技术目标的本发明实施例的一种处理音频信号的方法,包括以下步骤:接收使用MPEG环绕212(MPS212)编码了的音频比特流;基于在格式转换器中定义的MPS212输出声道的呈现参数和MPS212参数来生成一个双声道元素(CPE)的内部声道增益;基于所接收的音频比特流和所获得的内部声道增益来生成CPE的内部声道信号;以及基于所生成的内部声道信号来生成立体声输出声道信号。
-
公开(公告)号:CN108028988B
公开(公告)日:2020-07-03
申请号:CN201680035624.4
申请日:2016-06-17
Applicant: 三星电子株式会社
Abstract: 根据本发明实施例的用于解决技术问题的处理音频信号的方法进一步包括:接收被预先应用了内部声道增益(ICG)的一个双声道元素(CPE)的信号;当再现声道配置不是立体声时,基于运动图像专家组环绕212(MPS212)参数和格式转换器中定义的与MPS212输出声道相对应的呈现参数获取该一个CPE的逆ICG;以及基于所接收的该一个CPE的信号和所获取的逆ICG,生成输出信号。
-
公开(公告)号:CN110036654A
公开(公告)日:2019-07-19
申请号:CN201880004819.1
申请日:2018-01-15
Applicant: 三星电子株式会社
Abstract: 一种示例声音输出装置可以包括:输入单元;输出单元;以及处理器,被配置为基于声音输出装置的声压对经由输入单元接收的音频信号的频带执行第一滤波,基于声音输出装置的频率响应特性对经第一滤波的音频信号的频带执行第二滤波,基于经第二滤波的音频信号的感知音量等级调整所接收的音频信号的响度,并经由输出单元输出经调整的音频信号。
-
公开(公告)号:CN109801640A
公开(公告)日:2019-05-24
申请号:CN201910277101.6
申请日:2015-01-12
Applicant: 三星电子株式会社
IPC: G10L19/008 , H04S5/00
Abstract: 公开了一种用于再现三维音频的方法和设备。所述用于再现三维音频的方法可包括以下步骤:接收包括多个输入声道的多声道信号;并且响应于所述多声道信号的频率范围执行下混合以将所述多个输入声道的格式转换为具有高度感的多个输出声道。
-
-
-
-
-
-
-
-
-