-
公开(公告)号:CN116486837A
公开(公告)日:2023-07-25
申请号:CN202310426499.1
申请日:2023-04-19
Applicant: 中南林业科技大学
IPC: G10L25/63 , G10L17/26 , G10L25/18 , G10L25/30 , G06F18/15 , G06F18/2131 , G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于MFF‑ScSEnet的狗吠声情绪识别方法,对音频信号不同特征的提取进行融合,并在训练网络对频谱波纹信息进行增强,步骤一、将音频信号转换成mel‑频谱图;步骤二、将音频信号转换成sinc‑频谱图;步骤三、形成特征频谱图;步骤四、基于特征频谱图进行狗吠声情绪识别;将生成的特征频谱图通过主干网络resnet18进行狗吠声情绪识别;在Resnet18进行下采样后嵌入scSEnet注意力模块。本发明方法具有识别准确率高的特点,识别精度达91.45%。
-
公开(公告)号:CN115457965A
公开(公告)日:2022-12-09
申请号:CN202210972741.0
申请日:2022-08-14
Applicant: 中南林业科技大学
Abstract: 本发明公开了一种基于表征全局依赖关系的并行注意力机制鸟鸣声识别方法,该方法:首先,通过通道并行注意力模块表征任意时刻发声的时间帧和所有振动声音频率之间的相关性,构造鸟鸣声全局时频依赖关系,其次,通过挤压激励注意力模块自适应地校准特征图中不同通道所携带鸟鸣声信息的重要程度,最后将两个模块并行融合构成双并行注意力机制用于构造全局特征依赖关系。本发明提出的双并行注意力机制灵活地嵌入浅层卷积神经网络中,并且以较低的计算量在鸟鸣声数据集BirdsData上取得了98.1%的识别精度。
-