基于小波包分解和声谱图特征的动物声音识别方法

    公开(公告)号:CN106531174A

    公开(公告)日:2017-03-22

    申请号:CN201611058956.2

    申请日:2016-11-27

    Applicant: 福州大学

    Inventor: 李应 黄鸿铿

    CPC classification number: G10L17/26 G10L21/0208 G10L25/18

    Abstract: 本发明涉及一种基于小波包分解和声谱图特征的动物声音识别方法,提出了一种基于Bark尺度的小波包分解系数重构的频谱投影结合随机森林的动物声音识别方法。首先,声音信号先经过Bark尺度的小波包分解;然后,生成小波包分解系数重构信号的频谱图;接着,对这些频谱图进行投影并生成BWCSP特征;最后,通过随机森林分类器实现动物声音的识别。对于受背景声音影响严重的动物声音,采用短时谱估计法对声音信号进行增强。本发明所提出的方法,结合短时谱估计法、BWCSP特征和随机森林的方法能够识别各种背景声音下的动物声音,且在-10dB的情况下,能够保持平均60%以上的识别率。

Patent Agency Ranking