-
公开(公告)号:CN116486837A
公开(公告)日:2023-07-25
申请号:CN202310426499.1
申请日:2023-04-19
Applicant: 中南林业科技大学
IPC: G10L25/63 , G10L17/26 , G10L25/18 , G10L25/30 , G06F18/15 , G06F18/2131 , G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于MFF‑ScSEnet的狗吠声情绪识别方法,对音频信号不同特征的提取进行融合,并在训练网络对频谱波纹信息进行增强,步骤一、将音频信号转换成mel‑频谱图;步骤二、将音频信号转换成sinc‑频谱图;步骤三、形成特征频谱图;步骤四、基于特征频谱图进行狗吠声情绪识别;将生成的特征频谱图通过主干网络resnet18进行狗吠声情绪识别;在Resnet18进行下采样后嵌入scSEnet注意力模块。本发明方法具有识别准确率高的特点,识别精度达91.45%。
-
公开(公告)号:CN117789746A
公开(公告)日:2024-03-29
申请号:CN202311562288.7
申请日:2023-11-22
Applicant: 中南林业科技大学
IPC: G10L21/0272 , G10L21/0308 , G10L25/30 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种基于深度学习的混叠鸟鸣声分离方法,对混叠鸟鸣声信号的特征进行提取,并在分离网络中计算其掩码向量,再通过解码器输出纯净鸟鸣声,将所有训练样本训练100次,逐渐提高分离效果,步骤一、在编码器中计算混叠鸟鸣声信号的特征向量;步骤二、在分离网络中,使用该特征向量计算出每一个鸟鸣声声源对应的掩码向量;步骤三、使用掩码向量处理编码器特征;步骤四、使用解码器重构纯净鸟鸣声信号。本发明方法具有分离效果好的特点,SI‑SNRi和SDRi分别达16.8dB和17.2dB。
-