一种基于特征分层和改进ECAPA-TDNN的声学场景分类的方法

    公开(公告)号:CN114898772B

    公开(公告)日:2024-07-05

    申请号:CN202210710181.1

    申请日:2022-06-22

    Inventor: 艾欣 赵帅

    Abstract: 本发明公开了一种基于特征分层和改进ECAPA‑TDNN的声学场景分类的方法,包括在特征提取阶段,通过预加重、分帧、加窗、滤波操作得到梅尔频谱图;利用梅尔频谱结合谐波增强部分、打击源增强部分和残差部分的相对分量得到梅尔频谱谐波分量、打击源分量和残差分量;得到三层分量后,再将分量作为特征输入进结合群卷积的ECAPA‑TDNN当中。本发明的基于特征分层和改进ECAPA‑TDNN的声学场景分类的方法能够忽略背景噪音的同时,减少分类误差,并提升模型分类速度。

    一种基于特征分层和改进ECAPA-TDNN的声学场景分类的方法

    公开(公告)号:CN114898772A

    公开(公告)日:2022-08-12

    申请号:CN202210710181.1

    申请日:2022-06-22

    Inventor: 艾欣 赵帅

    Abstract: 本发明公开了一种基于特征分层和改进ECAPA‑TDNN的声学场景分类的方法,包括在特征提取阶段,通过预加重、分帧、加窗、滤波操作得到梅尔频谱图;利用梅尔频谱结合谐波增强部分、打击源增强部分和残差部分的相对分量得到梅尔频谱谐波分量、打击源分量和残差分量;得到三层分量后,再将分量作为特征输入进结合群卷积的ECAPA‑TDNN当中。本发明的基于特征分层和改进ECAPA‑TDNN的声学场景分类的方法能够忽略背景噪音的同时,减少分类误差,并提升模型分类速度。

Patent Agency Ranking