-
公开(公告)号:CN116343763A
公开(公告)日:2023-06-27
申请号:CN202310257571.2
申请日:2023-03-14
Applicant: 东南大学
IPC: G10L15/04 , G10L21/0208 , G10L25/45 , G10L25/30 , G10L25/24
Abstract: 本发明公开了一种基于混合特征的音频预警精准辨识方法,该方法对收集到的音频语音进行分析,确定预警信号的发出时间,从而对音频预警的及时性进行准确评测。首先,采用logmmse‑谱减法进行双重降噪,将录制的语音中的噪声信息滤除;接着,使用基于短时能量的端点检测,标注出待测语音中的有效语音段;然后,对有效语音段的每帧语音提取MFCC特征和波形多项式特征;继而,分别将两种特征作为卷积神经网络两个通道的输入,将两个通道的输出相加后得到混合特征;最后,将混合特征作为softmax函数的输入,通过最大概率值确定目标语音(音频预警信号)所在的语音段,该语音段的起始位置就是预警信号的发出时间。
-
公开(公告)号:CN115346514B
公开(公告)日:2025-04-25
申请号:CN202210947191.7
申请日:2022-08-08
Applicant: 东南大学
IPC: G10L15/01 , G10L15/02 , G10L15/04 , G10L15/06 , G10L15/16 , G10L21/0232 , G10L25/24 , G10L25/45
Abstract: 本发明公开了一种面向智能驾驶测评的音频预警智能识别方法,该方法对采集到的音频预警语音进行分析,确定音频预警的发出时间,从而对音频预警的时效性进行公正评测。首先,通过软阈值小波降噪,将语音中的噪声信息滤除;接着,使用基于双门限法的端点检测,标注出待测语音中的有效语音段;然后,对有效语音段的每帧语音提取MFCC特征;最后,用MFCC特征对LSTM网络进行训练,训练完成后可以检测出音频预警信号所在的语音段,该语音段的起始位置就是音频预警的发出时间。
-
公开(公告)号:CN115346514A
公开(公告)日:2022-11-15
申请号:CN202210947191.7
申请日:2022-08-08
Applicant: 东南大学
IPC: G10L15/01 , G10L15/02 , G10L15/04 , G10L15/06 , G10L15/16 , G10L21/0232 , G10L25/24 , G10L25/45
Abstract: 本发明公开了一种面向智能驾驶测评的音频预警智能识别方法,该方法对采集到的音频预警语音进行分析,确定音频预警的发出时间,从而对音频预警的时效性进行公正评测。首先,通过软阈值小波降噪,将语音中的噪声信息滤除;接着,使用基于双门限法的端点检测,标注出待测语音中的有效语音段;然后,对有效语音段的每帧语音提取MFCC特征;最后,用MFCC特征对LSTM网络进行训练,训练完成后可以检测出音频预警信号所在的语音段,该语音段的起始位置就是音频预警的发出时间。
-
-