一种面向重叠声音事件检测的音频高层语义特征提取方法及系统

    公开(公告)号:CN110931046A

    公开(公告)日:2020-03-27

    申请号:CN201911201939.3

    申请日:2019-11-29

    Applicant: 福州大学

    Abstract: 本发明涉及一种面向重叠声音事件检测的音频高层语义特征提取方法及系统,首先构建音频文件训练数据集,针对训练集中的不同场景的音频文件,选取梅尔能量特征构成输入矩阵;然后构建CBG深度卷积神经网络,将步骤S1得到的输入矩阵输入CBG深度卷积神经网络中,进行训练;最后对给定的音频文件,提取其梅尔能量特征,输入训练好的CBG深度卷积神经网络中,得到高层语义特征输出。本发明将传统音频物理特征变换为高层语义特征,可以提高后续检测的精度。

    音频监控中基于深度随机森林的声音事件分类方法

    公开(公告)号:CN110808070B

    公开(公告)日:2022-05-06

    申请号:CN201911112306.5

    申请日:2019-11-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种音频监控中基于深度随机森林的声音事件分类方法,包括以下步骤:步骤S1:从监控的音频文件中提取梅尔能量特征,并将其处理成特征序列;步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型,形成最终的深度随机森林声音事件分类模型;步骤S3:使用最终的深度随机森林声音事件分类模型对声音事件进行预测,得到声音事件的预测概率;步骤S4:根据得到的预测概率,进行事件分类后处理,得到声音事件分类结果。本发明基于随机森林的音频事件浅层检测方法和深度结构相结合,能够有效的对重叠声音事件进行检测并快速分类。

    音频监控中基于深度随机森林的声音事件分类方法

    公开(公告)号:CN110808070A

    公开(公告)日:2020-02-18

    申请号:CN201911112306.5

    申请日:2019-11-14

    Applicant: 福州大学

    Abstract: 本发明涉及一种音频监控中基于深度随机森林的声音事件分类方法,包括以下步骤:步骤S1:从监控的音频文件中提取梅尔能量特征,并将其处理成特征序列;步骤S2:对每一类声音事件训练一个深度随机森林分类器,通过组合多个二分类模型,形成最终的深度随机森林声音事件分类模型;步骤S3:使用最终的深度随机森林声音事件分类模型对声音事件进行预测,得到声音事件的预测概率;步骤S4:根据得到的预测概率,进行事件分类后处理,得到声音事件分类结果。本发明基于随机森林的音频事件浅层检测方法和深度结构相结合,能够有效的对重叠声音事件进行检测并快速分类。

Patent Agency Ranking