一种基于快速傅里叶变换的藏语语音数据生成方法

    公开(公告)号:CN119091857A

    公开(公告)日:2024-12-06

    申请号:CN202411590707.2

    申请日:2024-11-08

    Abstract: 本发明公开了一种基于快速傅里叶变换的藏语语音数据生成方法,该方法通过语音数据采集并在时域上应用汉明窗口函数以减少频谱泄漏,使用快速傅里叶变换算法将采集的音频信号从时域转换为频域,以实现高效的频率分析,设计巴特沃斯带通滤波器对频域中的语音数据进行滤波,以提取特定频率成分,利用余弦距离计算滤波前后信号的相似性,用以评估滤波效果,采用梯度下降算法搜索并优化滤波器参数,通过迭代优化,调整各参数以达到最佳滤波效果,使用快速傅里叶逆变换将最终的频域信号转换成时域信号,生成高质量的音频文件。本发明方案通过控制时频转换和滤波过程中的参数,有效提高了藏语语音数据的生成质量和准确性,大幅减少数据采集的成本。

Patent Agency Ranking