-
公开(公告)号:CN118411997A
公开(公告)日:2024-07-30
申请号:CN202410889674.5
申请日:2024-07-04
Applicant: 苏州大学
IPC: G10L21/0224 , G10L25/30 , G10L25/60 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G10L21/0208
Abstract: 本发明公开了一种基于时域神经网络的单通道语音回声消除方法,涉及回声消除技术领域,包括对采集麦克风信号进行分帧和数值归一化,提取时域帧序列特征,建立并训练时域神经网络模型;将采集麦克风信号输入至时域神经网络模型进行性能分析,并通过U‑Net编解码处理,输出回声消除后的语音序列。本发明通过提取一致的时域特征,提高神经网络的训练效率和稳定性;构建并训练基于Wave‑U‑Net架构的时域神经网络,通过分组卷积和注意力机制,增强回声消除的效果和适应复杂环境的能力;将信号输入模型进行性能分析,并通过U‑Net的U型编解码结构进行特征提取和重构,利用跳跃连接保留特征信息,实现高效回声消除和语音重构,提高语音清晰度和自然度。
-
公开(公告)号:CN118411997B
公开(公告)日:2024-12-13
申请号:CN202410889674.5
申请日:2024-07-04
Applicant: 苏州大学
IPC: G10L21/0224 , G10L25/30 , G10L25/60 , G06N3/0442 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08 , G10L21/0208
Abstract: 本发明公开了一种基于时域神经网络的单通道语音回声消除方法,涉及回声消除技术领域,包括对采集的麦克风信号进行分帧和数值归一化,提取时域帧序列特征,建立并训练时域神经网络模型;将采集的麦克风信号输入至时域神经网络模型进行性能分析,并通过U‑Net编解码处理,输出回声消除后的语音序列。本发明通过提取一致的时域特征,提高神经网络的训练效率和稳定性;构建并训练基于Wave‑U‑Net架构的时域神经网络,通过分组卷积和注意力机制,增强回声消除的效果和适应复杂环境的能力;将信号输入模型进行性能分析,并通过U‑Net的U型编解码结构进行特征提取和重构,利用跳跃连接保留特征信息,实现高效回声消除和语音重构,提高语音清晰度和自然度。
-