-
公开(公告)号:CN118692473A
公开(公告)日:2024-09-24
申请号:CN202410898777.8
申请日:2024-07-05
Applicant: 大连理工大学
IPC: G10L19/008 , G10L19/16 , G10L25/30
Abstract: 本发明公开了一种基于深度学习架构的骨传导语音信号传输方法,包括:获取骨传导语音信号以及对应的空气传导语音信号,基于骨传导语音信号与空气传导语音信号建立训练集和测试集,构建基于深度学习架构的骨传导语音编解码器网络,构建骨传导语音编解码器网络的损失函数,在划分好的训练集上训练骨传导语音编解码器网络,利用反向传播算法传递该网络的梯度值,反复迭代该网络参数、控制生成语音逼近空气传导语音信号从而获得最佳权重,完成该骨传导语音编解码器网络的训练过程;将测试集中的骨传导语音输入至加载最佳权重的骨传导语音编码器中,解码后获得对应的空气传导语音信号。本文方法能够在语音编码的同时实现语音增强,降低了使用的复杂度。
-
公开(公告)号:CN118506793A
公开(公告)日:2024-08-16
申请号:CN202410570455.0
申请日:2024-05-09
Applicant: 大连理工大学
Abstract: 本发明公开了一种骨传导语音信号传输方法,该方法将深度学习模型与传统的语音编解码器相结合,提出了一个新的适用于骨传导语音信号的自适应多速率宽带语音编解码器,专门设计了带宽扩展能力,以增强骨传导语音。通过深度学习网络将ISF参数从骨传导语音转换为空气传导语音,以重构骨传导语音的高频成分。还提出了一种新颖的生成对抗网络,集成了多种注意力机制和基于高阶统计量的损失函数,以逼近ISF参数之间复杂的非线性关系。该方法能够在语音编码的同时实现语音增强,降低了使用的复杂度。
-