一种基于深度学习的音频分类方法、系统、设备及介质

    公开(公告)号:CN119673201A

    公开(公告)日:2025-03-21

    申请号:CN202411721542.8

    申请日:2024-11-28

    Applicant: 中南大学

    Abstract: 本申请公开了一种基于深度学习的音频分类方法、系统、设备及介质,本方法通过获取音频序列,并对音频序列进行预处理,得到音频数据集;根据音频数据集分割音频帧,并提取音频数据集的频谱序列、小波相位图、小波强度图以及梅尔谱图;采用多组独立的多尺度特征提取模块分别提取音频帧、频谱序列、小波相位图、小波强度图以及梅尔谱图各自对应的特征向量,得到每组多尺度特征提取模块提取的特征向量;将每组多尺度特征提取模块提取的特征向量进行特征融合,得到特征融合向量;根据特征融合向量进行音频分类,得到音频分类结果。本申请能够提高音频分类的准确度和抗干扰性。

Patent Agency Ranking