-
公开(公告)号:CN119049494B
公开(公告)日:2025-03-25
申请号:CN202411505009.8
申请日:2024-10-28
Applicant: 中国海洋大学
IPC: G10L21/0208 , G10L21/0232 , G10L25/21
Abstract: 本发明属于语音增强技术领域,具体公开了一种基于谐波模型基频同步改进维纳滤波的语音增强方法,其根据最小均方误差准则推算维纳滤波器的响应函数,获得带噪语音信号经过维纳滤波器输出的预测语音信号的功率谱;通过基频估计算法获得预测语音信号的基频信息;预测语音信号经过加窗处理和基频同步的傅里叶变换后,对其浊音帧进行谐波建模,以获得重建相位信息;最后根据预测语音信号的功率谱开方得到的幅度谱以及重建相位信息合成增强语音信号。本发明方法引入谐波模型进行相位信息的重建,不再延用带噪语音的相位信息,并且基于基频同步,将基频参数引入到傅里叶变换中,摒弃固定的傅里叶变换长度和固定的窗长度,以达到更好的语音去噪增强效果。
-
公开(公告)号:CN119049494A
公开(公告)日:2024-11-29
申请号:CN202411505009.8
申请日:2024-10-28
Applicant: 中国海洋大学
IPC: G10L21/0208 , G10L21/0232 , G10L25/21
Abstract: 本发明属于语音增强技术领域,具体公开了一种基于谐波模型基频同步改进维纳滤波的语音增强方法,其根据最小均方误差准则推算维纳滤波器的响应函数,获得带噪语音信号经过维纳滤波器输出的预测语音信号的功率谱;通过基频估计算法获得预测语音信号的基频信息;预测语音信号经过加窗处理和基频同步的傅里叶变换后,对其浊音帧进行谐波建模,以获得重建相位信息;最后根据预测语音信号的功率谱开方得到的幅度谱以及重建相位信息合成增强语音信号。本发明方法引入谐波模型进行相位信息的重建,不再延用带噪语音的相位信息,并且基于基频同步,将基频参数引入到傅里叶变换中,摒弃固定的傅里叶变换长度和固定的窗长度,以达到更好的语音去噪增强效果。
-
公开(公告)号:CN116959463A
公开(公告)日:2023-10-27
申请号:CN202311218774.7
申请日:2023-09-21
Applicant: 中国海洋大学
IPC: G10L19/16 , G10L19/02 , G10L19/032 , G10L19/12 , G10L19/083 , H04B7/185 , G10L19/00
Abstract: 本发明属于北斗三号区域短报文通信技术领域,公开了一种应用于北斗三号RSMC的低码率语音传输方法,其包括如下步骤:录制语音信号,并对该语音信号进行预处理得到原始语音信号sig_input;对原始语音信号sig_input进行线性预测分析、傅里叶变换、基音周期分析、子带强度分析、非周期判决以及增益计算,分别获得线性预测系数LPC、傅里叶级数幅值FM、最终基音周期P3、子带强度、清浊音标志AF及增益G六种参数;对获得的六种参数进行向量量化处理;待量化完成后,通过组帧的方式,形成压缩语音编码,然后利用北斗三号RSMC服务,将压缩语音编码以短报文的形式进行传输,实现了北斗卫星短报文通信向语音通信的转变。
-
公开(公告)号:CN120032650A
公开(公告)日:2025-05-23
申请号:CN202510509991.4
申请日:2025-04-23
Applicant: 中国海洋大学
IPC: G10L19/008 , G10L19/022 , G10L19/04 , G10L19/02 , G10L21/0232 , G10L21/0224 , G10L25/18 , G10L25/24 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F17/13
Abstract: 本发明属于语音增强技术领域,公开了一种基于薛定谔桥的扩散模型语音增强方法及系统,该方法将扩散模型的扩散过程转化为随机微分方程的求解过程,并依据薛定谔桥的理论原理,确定随机微分方程,而且直接将复数谱作为扩散模型的输入,省去了从复数谱中提取相位谱和幅度谱的繁琐工作以及逆变换带来的内存开销,同时也避免了相位谱和幅度谱之间的对齐问题。本发明的语音增强方法通过Transformer模块捕捉时序信号的独特特征,再利用U‑Net模块融合多尺度信息,搭配涵盖时域、频域和时频域的损失函数,逐步缩小预测样本与干净样本的差异,能够直接学习从带噪样本到干净样本的非线性扩散过程,从而保留更多初始样本的结构信息。
-
-
-