利用抗噪幂归一化倒谱系数的鸟类声音识别方法

    公开(公告)号:CN102930870B

    公开(公告)日:2014-04-09

    申请号:CN201210368983.5

    申请日:2012-09-27

    Applicant: 福州大学

    Inventor: 颜鑫 李应

    Abstract: 本发明针对生态环境中各种背景噪声下的鸟类声音识别问题,提出了一种基于新型抗噪特征提取的鸟类声音识别技术。首先,根据适用于高度非平稳环境下的噪声估计算法求出噪声功率谱。其次,使用多频带谱减法对声音功率谱进行降噪处理。接着,结合降噪的声音功率谱提取抗噪幂归一化倒谱系数(APNCC)。最后,采用支持向量机(SVM)分别对提取的APNCC,幂归一化倒谱系数(PNCC)和Mel频率倒谱系数(MFCC)对34种鸟类声音进行不同环境和信噪比情况下的对比实验。实验表明,提取的APNCC具有较好的平均识别效果及较强的噪声鲁棒性,更适用于信噪比低于30dB环境下的鸟类声音识别。

    基于多频带信号重构的生态声音识别方法

    公开(公告)号:CN103474066A

    公开(公告)日:2013-12-25

    申请号:CN201310472342.9

    申请日:2013-10-11

    Applicant: 福州大学

    Inventor: 李应 欧阳桢

    Abstract: 本发明涉及一种基于多频带信号重构的生态声音识别方法,首先,使用OMP稀疏分解作第一阶段重构,保留前景声音的主体结构;其次,将前阶段分解的剩余分量按频带划分,根据前景声音和背景噪声的频率分布,对重构信号进行自适应补偿,完成第二阶段重构;最后,根据支撑集原子时频信息和频域信息提取复合抗噪特征,使用深信度网对生态声音在不同环境和信噪比情境下进行分类识别。本发明采用二次重构不仅能抑制噪声,并且提高了对前景声音的重构精度,在自然环境下具有较好的噪声鲁棒性。

    基于谱时幅度分级向量辨识环境声音事件的方法

    公开(公告)号:CN102789780A

    公开(公告)日:2012-11-21

    申请号:CN201210242825.5

    申请日:2012-07-14

    Applicant: 福州大学

    Inventor: 李应

    Abstract: 本发明涉及一种基于谱时幅度分级向量辨识环境声音事件的方法,首先计算各相关声音事件的谱时幅度分级向量(TSASV)作为辨识原型,并保存在数据库中作为分辨待测声音事件的模板;然后计算待测声音事件的TSASV,并将其与各辨识原型进行比较,最接近的一个就是所要识别的声音事件;谱时幅度分级向量的构造方法包括:对获取的环境声音事件进行快速傅立叶变换,生成声谱图;对生成的声谱图进行不同频率分辨的采样,用声谱图构建不同频率分辨的子声谱图;对子声谱图进行信号增强,生成信号增强的子声谱图;对信号增强的子声谱图进行幅度分级;对幅度分级后的子声谱图进行编码,生成TSASV。该方法有利于提高环境声音事件辨识的有效性。

    低信噪比环境下基于多频带能量分布的动物声音检测方法

    公开(公告)号:CN106653032B

    公开(公告)日:2019-11-12

    申请号:CN201611040015.6

    申请日:2016-11-23

    Applicant: 福州大学

    Inventor: 李应 王巧静

    Abstract: 本发明涉及一种低信噪比环境下基于多频带能量分布的动物声音检测方法,包括以下步骤:步骤S1:利用多滤波器组对待测声音样本进行时频分析,获得多频带频谱图;步骤S2:分析所述多频带频谱图的频率及能量分布,获取多频带能量分布图;步骤S3:对所述多频带能量分布图进行分块DCT,并提取DCT系数矩阵中的低频系数作为所述待测声音样本的特征;步骤S4:根据以上步骤对若干训练声音样本进行处理,获取训练声音样本的特征,并采用随机森林分类器对所述训练声音样本的特征进行训练,得到随机森林;步骤S5:将所述待测声音样本的特征代入随机森林进行测试,确定所述待测声音样本的类标。本发明相比于现有技术在低信噪比的情况下具有良好的鲁棒性。

    移动电子医疗中具有叛逆者追踪功能的可搜索加密系统

    公开(公告)号:CN107104982B

    公开(公告)日:2019-10-15

    申请号:CN201710387181.1

    申请日:2017-05-26

    Applicant: 福州大学

    Abstract: 本发明涉及一种移动电子医疗中具有叛逆者追踪功能的可搜索加密系统,针对现有移动医疗(mHealth)系统中的计算开销过大,无法支持叛逆者跟踪以及对用户进行按需撤销等问题,提出了一种新型的轻量级、可进行数据共享和访问权限控制、可进行叛逆者追踪的安全电子医疗系统(LiST)。除了使用基于属性的加密(ABE)机制实现对加密电子医疗记录(EHR)的细粒度访问控制,LiST还支持对加密的EHR的关键字搜索,提供高效的叛逆者追踪和灵活的用户撤销机制。

    基于卷积神经网络与随机森林分类的声音场景识别方法

    公开(公告)号:CN108231067A

    公开(公告)日:2018-06-29

    申请号:CN201810038744.0

    申请日:2018-01-13

    Applicant: 福州大学

    Inventor: 李应 李俊华

    Abstract: 本发明涉及一种基于卷积神经网络与随机森林分类的声音场景识别方法。首先,声音场景通过Mel滤波器生成Mel能量谱及其片段样本集;然后,利用片段样本集对CNN进行两阶段训练,截断全连接层的特征输出,得到片段样本集的CNN特征;最后,用随机森林对片段样本集的CNN特征进行分类,得到最终识别结果。相关实验结果表明,本发明方法在IEEE DCASE2016声音场景评估数据集上的识别率既优于Mel频率倒谱系数特征结合高斯混合模型(MFCC‑GMM)的基准方法,也优于现有的相关识别方法。

    低信噪比声场景下声音事件的识别方法

    公开(公告)号:CN104795064B

    公开(公告)日:2018-04-13

    申请号:CN201510141907.4

    申请日:2015-03-30

    Applicant: 福州大学

    Inventor: 李应 林巍

    CPC classification number: G10L15/06 G10L15/14 G10L15/20

    Abstract: 本发明涉及一种低信噪比声场景下声音事件的识别方法,该方法把待测声音事件中的场景声音,与声音事件样本集相结合,通过GLCM‑HOSVD提取声音数据的特征,生成判别待测声音事件判别的RF。利用这种方法生成的RF,可以在特定场景中,实现低信噪比下,声音事件的识别。实验结果表明,该方法能使声音事件与场景声音信噪比为‑5dB的情况,保持平均精度73%以上声音事件的识别率。与MP,SPD提取特征的方法相比,一定程度上说,我们所提出的这种方法解决了低信噪比情况下,声音事件的识别问题。

    基于快速稀疏分解和深度学习的生态声音识别方法

    公开(公告)号:CN103531199B

    公开(公告)日:2016-03-09

    申请号:CN201310472330.6

    申请日:2013-10-11

    Applicant: 福州大学

    Inventor: 李应 欧阳桢

    Abstract: 本发明涉及一种基于快速稀疏分解和深度学习的生态声音识别方法,其特征在于,包括以下步骤:S01:分别对纯净声音和测试带噪声音进行OMP稀疏分解,对应输出纯净声音和测试带噪声音的重构信号和OMP特征;S02:分别对纯净声音和测试带噪声音提取包括OMP特征在内的复合特征;S03:对重构后的纯净声音提取的复合特征进行DBN模型训练;S04:对重构后的测试带噪声音和训练后的纯净声音提取的复合特征进行DBN模型分类,输出测试带噪声音所属的生态声音类别。本发明对系统抗噪性和鲁棒性的提高更为显著。

    利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法

    公开(公告)号:CN103474072A

    公开(公告)日:2013-12-25

    申请号:CN201310473337.X

    申请日:2013-10-11

    Applicant: 福州大学

    Inventor: 李应 魏静明

    Abstract: 本发明涉及一种利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法,其特征在于:步骤1,通过短时谱估计算法对鸟鸣声带噪功率谱进行音频增强;步骤2,采用和差统计法(SDH)对增强功率谱快速提取纹理特征;步骤3,由随机森林(RF)实现快速分类。本发明解决了纹理特征提取过程中灰度共生矩阵(GLCM)占用空间大、耗时,以及识别和分类过程中常见单分类器分类速度慢的问题。

    一种基于MFCCM的音频数据检索方法

    公开(公告)号:CN101226558A

    公开(公告)日:2008-07-23

    申请号:CN200810070557.7

    申请日:2008-01-29

    Applicant: 福州大学

    Inventor: 李应

    Abstract: 本发明属于多媒体数据检索、处理技术,提提供一种基于MFCCM的音频数据检索方法,通过构建音MFCCM,对MFCCM进行多列塔型检索,MFCCM与mfcc_q矩阵列的相似性分析,计算MFCCM与mfcc_q相关帧的距离等步骤实现。本发明所采用的方法克服现有方法中存在的检索效率和检索精度的问题,为多媒体数据检索、处理,音频数据分析、索引、搜索和检索提供一种高效率和高精度的方法。

Patent Agency Ranking