双分支前景背景特征表征与融合的声音场景分类方法

    公开(公告)号:CN119107976A

    公开(公告)日:2024-12-10

    申请号:CN202411209829.2

    申请日:2024-08-30

    Applicant: 重庆大学

    Abstract: 本发明提供了一种双分支前景背景特征表征与融合的声音场景分类方法,包括卷积计算单元和分类器,其特征在于:还包括前景特征表征模块、背景特征表征模块和自包含特征交叉融合模块;所述方法包括:卷积计算单元对输入音频进行时频特征的提取,得到初始音频特征谱图;然后前景特征表征模块和背景特征表征模块并行对初始音频特征谱图进行处理,分别得到前景音频时频特征和背景音频时频特征;然后自包含特征交叉融合模块对前景音频时频特征和背景音频时频特征进行交叉融合,得到可用分类音频特征;分类器根据收到的可用分类音频特征对所述输入音频所属的声音场景进行分类后输出分类结果。采用本方法对声音场景进行分类,大大提高了声音场景的分类精度。

Patent Agency Ranking