Patent search ap:("中南大学") AND inv:"张伯宁" Page 1

1.

发明公开
一种基于深度学习的音频分类方法、系统、设备及介质审中-公开

公开(公告)号：CN119673201A

公开(公告)日：2025-03-21

申请号：CN202411721542.8

申请日：2024-11-28

Applicant: 中南大学

Inventor： 张伟 , 李晓航 , 张伯宁 , 贺建飚 , 成新明

IPC: G10L25/30 , G10L25/03 , G10L25/18 , G10L25/48 , G06N3/045

Abstract: 本申请公开了一种基于深度学习的音频分类方法、系统、设备及介质，本方法通过获取音频序列，并对音频序列进行预处理，得到音频数据集；根据音频数据集分割音频帧，并提取音频数据集的频谱序列、小波相位图、小波强度图以及梅尔谱图；采用多组独立的多尺度特征提取模块分别提取音频帧、频谱序列、小波相位图、小波强度图以及梅尔谱图各自对应的特征向量，得到每组多尺度特征提取模块提取的特征向量；将每组多尺度特征提取模块提取的特征向量进行特征融合，得到特征融合向量；根据特征融合向量进行音频分类，得到音频分类结果。本申请能够提高音频分类的准确度和抗干扰性。

Patent Agency Ranking