嵌入式语音或音频信号编解码方法和装置

    公开(公告)号:CN101572087A

    公开(公告)日:2009-11-04

    申请号:CN200810094434.7

    申请日:2008-04-30

    Abstract: 本发明公开了一种嵌入式语音或音频信号编解码方法和装置,涉及编码技术,为解决现有的嵌入式语音编码能够处理的信号频带较窄的问题而发明。本发明的技术方案为:嵌入式语音或音频信号编码方法,包括:根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;在宽带嵌入式编码层,对单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;在预设的高频信号编码层,对单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码。本发明实施例提供的嵌入式语音或音频信号编解码方法和装置可以应用在音/视频会议、电视电话会议、网络通信、移动通信、网络拥塞控制以及第三代和第四代移动通信领域中。

    嵌入式编码、解码方法、编码器、解码器及系统

    公开(公告)号:CN101256771A

    公开(公告)日:2008-09-03

    申请号:CN200710085362.5

    申请日:2007-03-02

    Abstract: 本发明实施例提供了一种嵌入式编码方法、解码方法、编码器、解码器和系统,该编码方法包括如下步骤:对语音信号进行代数码激励线性预测ACELP编码,得到ACELP层的码流;对语音信号进行变换域编码,得到变换域层的码流。由于ACELP编码通过逐级细化激励信号,较低码率的编码信号对应于包含代数脉冲数较少的激励信号,随着码率的提升,逐层增加代数脉冲的方式不断细化激励信号,当代数脉冲增加到一定数量后,对激励信号的细化作用不明显或者变差,因此本发明实施例采用ACELP和变换域编码联合编码的方式得到嵌入式码流,用变换域编码弥补ACELP编码的不足,从而保证了合成语音的质量。

    一种基于双路径网络的语音频带扩展方法

    公开(公告)号:CN117437932A

    公开(公告)日:2024-01-23

    申请号:CN202310396230.3

    申请日:2023-04-13

    Abstract: 本发明提出一种基于双路径网络的语音频带扩展方法,针对于现有频域频带扩展方法无法准确估计高频相位信息这一问题,能够同时预测高频幅度谱和复数谱信息并融合,以实现频带扩展任务中高频信息的准确估计。本发明包括模型训练阶段和测试阶段,训练阶段包括语音预处理、构建双路径频带扩展神经网络、构建双路径特征交互模块、双路径输出融合、网络损失计算,更新参数模型收敛。模型测试阶段则包括测试语音预处理、测试语音频带扩展。

    一种沉浸式宽带3D声场重放方法

    公开(公告)号:CN108632709B

    公开(公告)日:2021-04-27

    申请号:CN201810352481.0

    申请日:2018-04-19

    Abstract: 本发明公开一种沉浸式宽带3D声场重放方法,首先,计算在指定空间位置放置的场景A的虚拟声源到场景B中各个听音点的声学传输函数,将该函数值作为虚拟声源辐射声场的声压值;其次,设定场景B中某一墙面的扬声器阵列为规则的矩形等间距布局,并基于声波的波动特性,利用格林函数来建模所有扬声器到听音点的声学传播特征;再次,基于线性凸优化理论,将l1范数作为稀疏规则算子利用交替方向乘子法进行正则化运算,选取1倍频程内八个频带的中心频率计算扬声器权值,进行激活扬声器选取。最后,利用l2范数正则化,计算重放系统中激活扬声器的权值信号,使得在最小均方准则下,待重放声源的辐射声场和激活扬声器的辐射声场最接近。

    一种利用优势声源成分移除的多声源定位方法

    公开(公告)号:CN110275138B

    公开(公告)日:2021-03-23

    申请号:CN201910640408.8

    申请日:2019-07-16

    Abstract: 本发明提出一种利用优势声源成分移除的多声源定位方法,通过移除优势声源成分使声场景内各声源的波达方向估计更准确。首先,将声场麦克风采集信号变换到频域获得频率系数,对频域信号按频率范围进行子带划分并计算声场麦克风各通路间相同频率范围子带的归一化互相关系数;其次,检测单声源子带,对单声源子带内各时‑频点对应角度进行估计;再次,利用各个历史帧的帧内优势声源确定全局候选优势声源,结合时‑频点角度估计值和全局候选优势声源确定全局优势声源角度并设立移除区间,对当前帧角度估计值落入移除区间的时‑频点成分进行移除;最后,对若干帧经过移除处理后的时‑频点角度估计值进行后处理以获得各声源角度的准确估计。

    一种利用变换域稀疏化和压缩降维的音频检索方法

    公开(公告)号:CN110647656A

    公开(公告)日:2020-01-03

    申请号:CN201910876038.8

    申请日:2019-09-17

    Abstract: 本发明智能应用型音频信号处理领域,具体涉及一种利用变换域稀疏化和压缩降维的音频检索方法。该方法用音频指纹作为音频检索特征,本技术在音频检索的训练阶段通过利用变换域稀疏化和压缩降维先对样本音频数据进行压缩,再对压缩后的音频序列提取音频指纹,使得提取的音频指纹数据量减小,从而减小样本音频指纹库的数据量。在音频检索的识别(检索)阶段用相同的算法压缩待检音频后提取待检音频指纹和样本音频指纹匹配很大程度上提高了检索效率。

    一种基于离散基尼系数的音频指纹降维方法

    公开(公告)号:CN110600038A

    公开(公告)日:2019-12-20

    申请号:CN201910784077.5

    申请日:2019-08-23

    Inventor: 贾懋珅 赵文兵

    Abstract: 本发明涉及一种基于离散基尼系数计算的音频指纹降维方法,旨在解决音频指纹特征维度高的问题,具体包括分类构建目标声音库、提取样本音频的指纹特征、引入离散基尼系数对音频指纹特征进行降维。本发明在音频指纹各维度引入指纹离散基尼系数,通过音频指纹各维度的离散基尼系数大小反映出不同音频在该维的区分性大小,通过保留离散基尼系数大的维度,删除离散基尼系数小的维度达到降维的目的。通过降维后的音频指纹特征构建的样本音频指纹库数据量更小、利用率更高。

    一种基于球谐展开的多声道转换方法

    公开(公告)号:CN103888889B

    公开(公告)日:2016-01-13

    申请号:CN201410137391.1

    申请日:2014-04-07

    Abstract: 本发明提出一种基于球谐展开的多声道转换方法,主要适用于将L1路多声道扬声器系统转换为L2路多声道扬声器系统。基于声场的线性叠加理论,根据声道数的不同采用相应阶数的球谐函数分别计算转换前后扬声器系统的声场,在保证转换前后扬声器系统在一定阶数下球谐展开声场相同的情况下,计算出转换后系统各个扬声器的增益系数。本发明实时运算复杂度低,能够在转换后系统上恢复出听音区域内原始重放系统的声场,可用于多声道三维音频系统的精简压缩及上混合技术,可以有效地兼容各种扬声器重放系统及减少传输带宽。

    编解码方法、装置及系统
    29.
    发明授权

    公开(公告)号:CN101572586B

    公开(公告)日:2012-09-19

    申请号:CN200810094441.7

    申请日:2008-04-30

    Abstract: 本发明实施例公开了一种编解码方法、装置及系统,涉及通信技术,能够编码形成具有嵌入式结构的码流,获得较高质量的解码信号。本发明实施例提供的技术方案包括一种编码方法,该方法包括:获取信号的至少两个子带;获取所述各子带的幅度包络量化值;利用所述各子带的幅度包络量化值获取所述各子带的层次排序和所述各子带的编码信息;根据所述各子带的层次排序将所述各子带的编码信息写入码流。

    嵌入式语音或音频信号编解码方法和装置

    公开(公告)号:CN101572087B

    公开(公告)日:2012-02-29

    申请号:CN200810094434.7

    申请日:2008-04-30

    Abstract: 本发明公开了一种嵌入式语音或音频信号编解码方法和装置,涉及编码技术,为解决现有的嵌入式语音编码能够处理的信号频带较窄的问题而发明。本发明的技术方案为:嵌入式语音或音频信号编码方法,包括:根据单声道超宽带语音或音频信号所占用的频带,将所述信号划分成低频子频带和高频子频带;在宽带嵌入式编码层,对单声道超宽带语音或音频信号的低频子频带信号进行嵌入式编码;在预设的高频信号编码层,对单声道超宽带单声道语音或音频信号的高频子频带信号进行嵌入式编码。本发明实施例提供的嵌入式语音或音频信号编解码方法和装置可以应用在音/视频会议、电视电话会议、网络通信、移动通信、网络拥塞控制以及第三代和第四代移动通信领域中。

Patent Agency Ranking