-
公开(公告)号:CN119905110A
公开(公告)日:2025-04-29
申请号:CN202510126540.2
申请日:2025-01-27
Applicant: 北京华控智加科技有限公司
Abstract: 本发明公开了一种基于预训练神经网络的任意采样率声音分析方法,涉及声音分析技术领域。包括以下步骤,获取输入音频,转化语谱图,将输入音频进行短时傅里叶变换得到语谱图。本发明解决对采样率跨度差异较大的各种声音信号(如8KHz‑192KHz)统一建模困难的问题。不同于传统的基于重采样的方法,本发明提出在时频域的语谱图上进行固定频段的子带切分,对子带进行建模,可以将任意采样率的语谱图分解为子带图的组合,对子带图提取高维表征后进行向量拼接,得到最终信号表征。在高维表征层面进行向量距离计算判断声音片段之间的相似度。该方法不仅适用于声音,对高频振动等数字信号同样适用。