-
公开(公告)号:CN112530454B
公开(公告)日:2024-07-23
申请号:CN202011376870.0
申请日:2020-11-30
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种窄带语音信号检测方法,包括:对待检测的语音信号进行傅里叶变换,以计算语音信号的全频段幅度谱能量;根据全频段幅度谱能量,计算高频平均能量和低频平均能量;其中,高频为5kHz~6kHz,低频为2.5kHz~3.5kHz;根据高频平均能量和低频平均能量,计算能量衰减比;当能量衰减比大于第一预设值时,判定待检测的语音信号为窄带语音信号。本发明利用语音信号本身的特征进行统计,并设计相关门限来判断的方法,能有效识别宽带信号和窄带信号,并且计算和内存占用资源小,可实时应用于会议系统和终端设备中,以解决在多方会议通信时,窄带语音信号和宽带语音信号的交替出现使得频带扩展算法无法很好的作用在窄带语音信号的问题,有效提升频带扩展的效果。
-
公开(公告)号:CN112530460A
公开(公告)日:2021-03-19
申请号:CN202011376869.8
申请日:2020-11-30
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L25/60 , G10L21/0208 , G10L21/02
Abstract: 本发明公开了一种语音增强质量评估方法、装置、终端及存储介质,利用干净语音信号作为原始信号,在进行语音增强之前叠加不同类型的噪声生成带噪语音信号,接着通过语音增强算法处理生成语音增强信号,最后将干净的原始语音信号和语音增强信号导入PESQ中得到语音增强质量评估分数,该方法可以任意地模拟不同场景的带噪语音信号,实现在大规模的场景测试中更加灵活方便地进行语音增强质量评估。
-
公开(公告)号:CN111341331A
公开(公告)日:2020-06-26
申请号:CN202010117498.5
申请日:2020-02-25
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/02 , G10L21/0208
Abstract: 本发明公开了一种基于局部注意力机制的语音增强方法,包括:采集待处理语音,对待处理语音进行语音合成处理,得到待增强语音;对待增强语音进行特征提取,得到待增强语音的多维特征;建立基于局部注意力机制的RNN模型,并将多维特征输入至RNN模型;对RNN模型进行训练,得到语音增强模型;根据语音增强模型对多维特征进行计算得到时频掩蔽因子,根据时频掩蔽因子以及待增强语音的频谱,得到待增强语音的增强语音频谱;根据增强语音频谱得到语音增强波形。本发明提供的一种基于局部注意力机制的语音增强方法及系统,能够有效提高语音增强的效果,且能够有效提高语音增强的稳定性和可靠性。
-
公开(公告)号:CN112233685B
公开(公告)日:2024-04-19
申请号:CN202010933415.X
申请日:2020-09-08
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L19/022 , G10L19/26 , G10L25/18 , G10L25/27 , G10L25/45
Abstract: 本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置,所述方法包括:基于窄带语音信号生成伪高频信号;计算所述伪高频信号的功率谱能量;通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。本发明实施例既保证了扩频效果,保证语音质量,还可应用部署于要求时延低,内存小、计算能力较弱的通信设备。
-
公开(公告)号:CN111179958A
公开(公告)日:2020-05-19
申请号:CN202010016846.X
申请日:2020-01-08
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L21/0208
Abstract: 本发明公开了一种语音晚期混响抑制方法及系统,属于语音处理技术领域。本发明的方法为先采集室内的混响语音信号,提取混响衰减参数;再根据混响衰减参数计算混响频谱特征a;之后根据混响频谱特征a及朴素谱减法计算混响抑制后的语音频谱特征b;然后对语音频谱特征b进行插值计算,利用混响语音信号的相位特征对语音频谱特征b进行还原得到波形语音,并输出该波形语音。本发明的系统包括采集单元、计算单元、传输单元和终端,采集单元与计算单元电连接,计算单元和终端分别与传输单元连接;本发明的目的在于克服现有技术中,语音晚期混响抑制方法不能适应时变的混响环境的不足,本发明可以适应时变的混响环境,稳定抑制晚期混响。
-
公开(公告)号:CN112201261B
公开(公告)日:2024-05-03
申请号:CN202010933315.7
申请日:2020-09-08
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明实施例公开一种基于线性滤波的频带扩展方法、装置及会议终端系统,所述方法包括:对样本窄带语音信号进行上采样处理,得到采样后的时域语音信号;提取所述时域语音信号的LPC系数和LPC残差;利用所述LPC系数对待扩频的语音信号进行一阶FIR滤波器滤波,得到残差语音信号;根据所述LPC残差和所述LPC系数确定脉冲响应信号;利用所述残差语音信号生成宽带激励信号;对所述脉冲响应信号进行傅里叶变换,得到傅里叶变换结果;将所述宽带激励信号和所述傅里叶变换结果进行相乘,并对相乘结果进行逆傅里叶变换,得到频带扩展后的宽带信号。本发明实施例既能够降低计算开销、占用内存,且相比于传统频带扩展方法,能够提升语音质量、适用于各种编解码场景。
-
公开(公告)号:CN112530454A
公开(公告)日:2021-03-19
申请号:CN202011376870.0
申请日:2020-11-30
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种窄带语音信号检测方法,包括:对待检测的语音信号进行傅里叶变换,以计算语音信号的全频段幅度谱能量;根据全频段幅度谱能量,计算高频平均能量和低频平均能量;其中,高频为5kHz~6kHz,低频为2.5kHz~3.5kHz;根据高频平均能量和低频平均能量,计算能量衰减比;当能量衰减比大于第一预设值时,判定待检测的语音信号为窄带语音信号。本发明利用语音信号本身的特征进行统计,并设计相关门限来判断的方法,能有效识别宽带信号和窄带信号,并且计算和内存占用资源小,可实时应用于会议系统和终端设备中,以解决在多方会议通信时,窄带语音信号和宽带语音信号的交替出现使得频带扩展算法无法很好的作用在窄带语音信号的问题,有效提升频带扩展的效果。
-
公开(公告)号:CN112233685A
公开(公告)日:2021-01-15
申请号:CN202010933415.X
申请日:2020-09-08
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L19/022 , G10L19/26 , G10L25/18 , G10L25/27 , G10L25/45
Abstract: 本发明实施例公开一种基于深度学习注意力机制的频带扩展方法及装置,所述方法包括:基于窄带语音信号生成伪高频信号;计算所述伪高频信号的功率谱能量;通过预先训练好的逆滤波参数估计模型,获取所述伪高频信号功率谱能量对应的逆滤波参数;所述逆滤波参数估计模型为基于深度学习注意力机制,以伪高频信号的功率谱能量作为输入,逆滤波参数作为输出训练得到;将所述逆滤波参数与所述伪高频信号的频谱相乘,得到相乘结果;对所述相乘结果进行逆傅里叶变换和低通滤波处理,得到宽带信号。本发明实施例既保证了扩频效果,保证语音质量,还可应用部署于要求时延低,内存小、计算能力较弱的通信设备。
-
公开(公告)号:CN111210802A
公开(公告)日:2020-05-29
申请号:CN202010016814.X
申请日:2020-01-08
Applicant: 厦门亿联网络技术股份有限公司
IPC: G10L13/02 , G10L21/007 , G10L25/27 , G10K15/08 , G06N3/08
Abstract: 本发明公开了一种生成混响语音数据的方法和系统,属于语音数据生成领域。本发明的方法为:先采集语音数据,并采用仿真的方式生成RIR数据;之后对语音数据进行处理,再通过卷积运算将处理后的语音数据和RIR数据合成混响语音数据。本发明的系统包括采集单元、计算单元和存储单元,采集单元与计算单元电连接,计算单元通过传输单元与存储单元连接。本发明的目的在于克服现有技术中,不能生成大量的混响语音数据,导致深度学习所需的混响语音数据匮乏的不足,提供了一种生成混响语音数据的方法和系统,可以生成批量的混响语音数据,从而满足深度学习对混响语音数据的需求。
-
公开(公告)号:CN111341351B
公开(公告)日:2023-05-23
申请号:CN202010117497.0
申请日:2020-02-25
Applicant: 厦门亿联网络技术股份有限公司
Abstract: 本发明公开了一种基于自注意力机制的语音活动检测方法,包括:采集待处理语音,对待处理语音进行语音合成处理,得到待检测语音;对待检测语音进行特征提取,得到待检测语音的多维特征;建立基于自注意力机制的RNN模型,并将多维特征输入至RNN模型;对RNN模型进行训练,得到语音检测模型;语音检测模型根据多维特征计算待检测语音的状态值,并根据状态值判断待检测语音的类别。本发明提供的一种基于自注意力机制的语音活动检测方法及装置,能够有效提高语音活动检测的效果,且能够有效提高语音活动检测的稳定性和可靠性。
-
-
-
-
-
-
-
-
-