-
公开(公告)号:CN118230747A
公开(公告)日:2024-06-21
申请号:CN202410198267.X
申请日:2024-02-22
Applicant: 南京大学 , 北京地平线信息技术有限公司
Abstract: 本发明公开了一种适用于语音增强的轻量级神经网络系统及其方法。其系统包括编码器、增强器和解码器,编码器包括:频谱压缩模块,用于对含噪语音频谱在频率维度进行压缩;卷积模块,用于对频谱压缩模块压缩后的特征图做特征提取和频率维度的降采样;分组膨胀卷积模块,用于对卷积模块输出的特征图做进一步特征提取和频率维度的降采样,然后将特征图送入增强器;解码器包括:分组膨胀反卷积模块,用于对经增强器增强后的特征图做特征重建和频率维度的升采样;反卷积模块,用于对特征图做进一步的特征重建和频率维度的升采样;频谱扩张模块,用于对特征图的频率维度进行扩张。本发明可以以较低的参数量和计算量开销实现较高性能的语音增强。
-
公开(公告)号:CN115294996A
公开(公告)日:2022-11-04
申请号:CN202210684642.2
申请日:2022-06-17
Applicant: 南京大学 , 北京地平线信息技术有限公司
IPC: G10L21/0208 , G10L21/0272
Abstract: 本发明公开了一种用于非线性声学回声消除的半盲源分离方法。包括如下步骤:(1)获取待处理的含有非线性回声的麦克风信号;(2)对非线性映射输入信号进行基函数展开,并利用基于卷积传递函数近似的短时傅里叶变换得到时频域观测模型,得到用于非线性声学回声消除的半盲源分离模型;(3)根据所述半盲源分离模型,基于辅助函数独立向量分析方法或者独立低秩矩阵分析方法实现信号的半盲源分离,优化分离矩阵并分离出近端时频域信号;(4)通过短时傅里叶逆变换得到时域近端信号。本发明的方法具有有效的非线性回声消除性能。
-
公开(公告)号:CN114974188A
公开(公告)日:2022-08-30
申请号:CN202210543147.X
申请日:2022-05-18
Applicant: 北京地平线信息技术有限公司
Inventor: 程光伟 , 朱长宝 , 其他发明人请求不公开姓名
IPC: G10H1/36
Abstract: 公开了一种K歌音频处理方法、装置及计算机可读存储介质。其中,该方法包括:获取K歌用户的图像和/或音频信息;基于图像和/或音频信息,确定K歌用户的用户属性;基于用户属性,对K歌用户的人声音频进行EQ音效处理。本公开的实施例能够自动为不同K歌用户适配相应的EQ音效,而无需手动调整EQ音效,整个过程实施起来非常便捷,且能够有效地保证K歌体验。
-
公开(公告)号:CN115866482A
公开(公告)日:2023-03-28
申请号:CN202211176938.X
申请日:2022-09-26
Applicant: 北京地平线信息技术有限公司
IPC: H04R3/00
Abstract: 公开了一种音频处理方法及装置,该方法可以获取待处理音频信号,确定主链信号及侧链信号。将侧链信号输入谐波生成器,分别生成奇次谐波信号和偶次谐波信号。确定奇次谐波信号的增益和偶次谐波信号的增益,得到增益后的奇次谐波信号和偶次谐波信号。混合增益后的奇次谐波信号和偶次谐波信号及主链信号,得到音频输出信号。本公开提供的方法可以通过产生奇次谐波信号和偶次谐波信号来改变待处理音频信号的非线性特性,还可以通过确定谐波信号的增益控制奇次谐波信号和偶次谐波信号的比例,能够实现对谐波结构的精确调整,进而实现对待处理音频信号的精细调整,可以提升待处理音频信号的清晰度、明亮度和可懂度。
-
公开(公告)号:CN114842820A
公开(公告)日:2022-08-02
申请号:CN202210542761.4
申请日:2022-05-18
Applicant: 北京地平线信息技术有限公司
Inventor: 程光伟 , 朱长宝 , 其他发明人请求不公开姓名
Abstract: 公开了一种K歌音频处理方法、装置及计算机可读存储介质。其中,该方法包括:获取目标歌曲的节奏信息;确定与节奏信息匹配的混响音效信息;基于混响音效信息,调整目标歌曲的K歌音频的混响音效。本公开的实施例能够自动为不同节奏的歌曲适配相应的混响音效,而无需手动调整混响音效,整个过程实施起来非常便捷,且能够有效地保证K歌体验。
-
公开(公告)号:CN116913308A
公开(公告)日:2023-10-20
申请号:CN202310707811.4
申请日:2023-06-15
Applicant: 南京大学
IPC: G10L21/0316 , G10L21/0216 , G10L21/0232 , G10L19/02 , G10L25/18 , G10L25/21 , G10L25/24
Abstract: 本发明公开了一种平衡降噪量和语音音质的单通道语音增强方法。该方法步骤如下:(1)将含噪信号变换到时频域,并利用PEFAC方法估计基频;(2)计算后验信噪比,根据基频估计在倒谱域对其平滑,进而利用固定先验的方法估计后验语音存在概率;(3)根据后验语音存在概率估计噪声功率谱密度;(4)更新后验信噪比,计算语音功率谱密度的最大似然估计;(5)根据基频估计在倒谱域平滑语音功率谱密度,并增强基频,得到先验信噪比的估计;(6)利用自适应先验的方法再次估计后验语音存在概率;(7)计算基于广义伽马先验的对数谱幅度增益,并结合后验语音存在概率导出基于语音存在不确定性的增益估计;(8)增强语谱并变换回时域,得到增强信号。
-
-
-
-
-