联合耳蜗语音特征和跳变深层神经网络的语音增强算法

    公开(公告)号:CN111899750A

    公开(公告)日:2020-11-06

    申请号:CN202010743992.2

    申请日:2020-07-29

    Abstract: 本发明公开了联合耳蜗语音特征和跳变深层神经网络的语音增强算法,采用MMSE为前端的改进MRCG语音特征,通过比较不同特征作为网络输入的语音增强效果;分析DNN与Skip-DNN滤除“音乐噪声”的能力,建立了联合改进MRCG和Skip-DNN的语音增强模型,由实验可知,联合改进MRCG和Skip-DNN的语音增强模型比MRACC与MRCG增强效果好;同时,在低信噪比与非平稳背景噪声环境中,Skip-DNN滤除了部分“音乐噪声”,很好的拟合了改进MRCG与IRM之间复杂的非线性关系,提高低信噪比环境中语音增强效果,获得更清晰的语音特征,可有效提高语音可懂度和语音质量。

    一种汽车室内次级声源布放方法及主动噪声控制系统

    公开(公告)号:CN110696757A

    公开(公告)日:2020-01-17

    申请号:CN201911042372.X

    申请日:2019-10-30

    Abstract: 针对采用矩形或圆柱空间声学结构布放次级声源受车身结构和室内内饰影响的问题,本发明提供一种汽车室内次级声源布放方法及主动噪声控制系统,属于汽车室内主动降噪技术领域。本发明方法为将主动噪声控制系统中的次级声源布放在司乘人员头部附近,利用汽车结构有限元模型获得车室内输出响应点声压级分布及车室内的降噪量,根据获得的声压级分布及降噪量确定次级声源的布放位置。本发明给出三种方案,第一种:两个次级声源布放在汽车的侧壁上,两个次级声源与相邻司乘人员的头部同高,且与头部的距离均相等。第二种:在司乘人员头部正上方的汽车顶棚处布放次级声源。第三种:在司乘人员头部正下方的汽车底盘上布放次级声源。

    一种基于RNN的语音降噪方法及语音识别方法

    公开(公告)号:CN109712628A

    公开(公告)日:2019-05-03

    申请号:CN201910196487.8

    申请日:2019-03-15

    Abstract: 一种基于RNN的语音降噪方法及语音识别方法,在噪声环境下提取性能更好的语音信号特征参数,属于语音识别领域。本发明包括:建立DRNN降噪模型:在RNN的基础上增加两层隐含层,所述两层隐含层上无连接层,RNN原有的隐含层位于增加的两层隐含层中间,三层隐含层位于输入层和输出层之间;将带噪声的语音训练信号X进行补零,使维度保持一致,并将补零后的信号分成N组,每组三个数据,将分组后的数据输入到DRNN降噪模型中进行训练,确定DRNN降噪模型的参数;利用确定参数的DRNN降噪模型对语音信号或特征参数进行降噪。语音识别方法是在现有基础上在识别和训练之前先对特征参数采用DRNN降噪模型进行降噪。

    一种基于RNN建立的DRNN降噪模型的语音降噪方法及语音识别方法

    公开(公告)号:CN109712628B

    公开(公告)日:2020-06-19

    申请号:CN201910196487.8

    申请日:2019-03-15

    Abstract: 一种基于RNN建立的DRNN降噪模型的语音降噪方法及语音识别方法,在噪声环境下提取性能更好的语音信号特征参数,属于语音识别领域。本发明包括:建立DRNN降噪模型:在RNN的基础上增加两层隐含层,所述两层隐含层上无连接层,RNN原有的隐含层位于增加的两层隐含层中间,三层隐含层位于输入层和输出层之间;将带噪声的语音训练信号X进行补零,使维度保持一致,并将补零后的信号分成N组,每组三个数据,将分组后的数据输入到DRNN降噪模型中进行训练,确定DRNN降噪模型的参数;利用确定参数的DRNN降噪模型对语音信号或特征参数进行降噪。语音识别方法是在现有基础上在识别和训练之前先对特征参数采用DRNN降噪模型进行降噪。

    基于FXLMS算法的发动机噪声控制方法

    公开(公告)号:CN109859733A

    公开(公告)日:2019-06-07

    申请号:CN201910001578.1

    申请日:2019-01-02

    Abstract: 本发明针对发动机进气系统引起的车内噪声的问题,提供一种基于FXLMS算法的发动机噪声控制方法,属于噪声控制领域。本发明包括:S1、以FXLMS算法建立发动机进气噪声的主控制系统模型,利用发动机的转速构造主控制系统模型的参考信号x(k);S2、建立离线辨识结构,对主动控制系统模型中次级通道传递函数H2(z)进行辨识,并将辨识结果提供给主动控制系统模型;S3、利用辨识后的主动噪声控制系统模型对发动机噪声进行控制。并提出了改进的变步长算法,该算法为归一化算法步长添加参数γ并代替正弦变步长中的β来调整步长的幅值范围,不仅具有正弦变步长算法的收敛快、稳态误差小的优点,且具有归一化算法适应时变参考信号的特性,参数易于选取的优点。

    基于概率神经网络的水轮机运行故障诊断方法

    公开(公告)号:CN109751173A

    公开(公告)日:2019-05-14

    申请号:CN201910041205.7

    申请日:2019-01-16

    Abstract: 本发明提供一种故障诊断的结果更精准的基于概率神经网络的水轮机运行故障诊断方法,属于水轮机压力脉动监测与诊断领域。本发明包括:将水轮机的主要相关工况参数与压力脉动信号进行特征融合形成融合特征向量,作为概率神经网络的输入,将水轮机的运行状态作为所述概率神经网络的输出,构建概率神经网络的故障诊断模型;S2、利用构建的故障诊断模型实时监测水轮机的运行状态,进行故障诊断。本发明将水轮机运行工况和压力脉动信号一同作为特征进行识别,通过对历史数据进行互信息计算,并根据计算的互信息,求得水轮机各种工况参数对压力脉动信号影响的重要程度,进而求得水轮机的主要相关工况参数。

    联合耳蜗语音特征和跳变深层神经网络的语音增强算法

    公开(公告)号:CN111899750B

    公开(公告)日:2022-06-14

    申请号:CN202010743992.2

    申请日:2020-07-29

    Abstract: 本发明公开了联合耳蜗语音特征和跳变深层神经网络的语音增强算法,采用MMSE为前端的改进MRCG语音特征,通过比较不同特征作为网络输入的语音增强效果;分析DNN与Skip‑DNN滤除“音乐噪声”的能力,建立了联合改进MRCG和Skip‑DNN的语音增强模型,由实验可知,联合改进MRCG和Skip‑DNN的语音增强模型比MRACC与MRCG增强效果好;同时,在低信噪比与非平稳背景噪声环境中,Skip‑DNN滤除了部分“音乐噪声”,很好的拟合了改进MRCG与IRM之间复杂的非线性关系,提高低信噪比环境中语音增强效果,获得更清晰的语音特征,可有效提高语音可懂度和语音质量。

    一种改进多分辨率残差U型网络的语音增强方法

    公开(公告)号:CN113707164A

    公开(公告)日:2021-11-26

    申请号:CN202111026177.5

    申请日:2021-09-02

    Abstract: 一种深度神经网络,特别涉及一种改进多分辨率残差U型网络语音增强方法,为使得传统的多分辨率残差U型网络更加适用于时频域上的语音增强任务,针对其在解码阶段恢复出低信噪比下的语音细节的能力弱、容易造成语音特征丢失的问题进行改进,同时改变了卷积核的大小以适应语音信号转化到时频域后通常得到的语音特征图的尺寸是宽度远大于高度的特点,属于语音增强领域。本发明包括:S1、将纯净和带噪语音通过短时傅里叶变换得到两种语音信号的幅度谱;S2、以带噪语音幅度谱作为网络的输入,纯净语音幅度谱作为训练目标;通过改进的多分辨率残差U型网络拟合网络输入与训练目标之间的非线性关系,进而得到基于改进的多分辨率残差U型网络的语音增强模型;S3、通过STFT获取带噪语音的幅度谱;将其通过改进的多分辨率残差U型网络模型,即可得到目标语音的幅度谱;S4、将幅度谱与带噪语音相位结合,进行波形重建,重建后即可得到增强语音。

    一种基于人脸特征检测疲劳驾驶的方法

    公开(公告)号:CN109409347A

    公开(公告)日:2019-03-01

    申请号:CN201811609791.2

    申请日:2018-12-27

    Abstract: 一种基于人脸特征检测疲劳驾驶的方法,涉及一种人工智能检测疲劳驾驶的方法。本发明对眼睛与嘴部特征联合检测可判断驾驶员的疲劳状态,避免了因佩戴眼镜而无法进行准确检测。检测方法:一、图像采集;二、图像处理;三、基于改进的Adboost算法分类器进行人脸定位;四、检测到人脸进行下一步,未检测到人脸进行步骤一;五、人脸特征识别;六、疲劳状态判定。本发明与传统监测方法相比联合运用眼睛与嘴部状态进行疲劳状态的特征提取,提高了判断的准确性、降低了疲劳驾驶检测的误判几率。

    一种跳变连接深度神经网络的语音增强方法

    公开(公告)号:CN111192598A

    公开(公告)日:2020-05-22

    申请号:CN202010012435.3

    申请日:2020-01-07

    Abstract: 一种跳变连接深度神经网络的语音增强方法,解决了传统的深度神经网络DNN语音增强方法在低信噪比场景下语音有丢失、可懂度低的问题,属于语音增强领域。本发明包括:根据时域语音信号,提取时频域特征;确定训练目标,并将训练目标和提取的时频域特征送入到Skip-DNN模型中,进行训练,得到Skip-DNN语音增强模型;Skip-DNN模型的输入层、隐藏层和输出层之间采用跳变连接;S3、提取带噪语音特征,将其输入到Skip-DNN语音增强模型中,估计目标语音;S4、将目标语音与带噪语音合成,得到增强的纯净语音信号。

Patent Agency Ranking