基于三分支特征融合神经网络的声音事件检测方法

    公开(公告)号:CN114881213A

    公开(公告)日:2022-08-09

    申请号:CN202210490937.6

    申请日:2022-05-07

    Applicant: 天津大学

    Inventor: 谢宗霞 周雨馨

    Abstract: 本发明公开了一种基于三分支特征融合神经网络的声音事件检测方法,包括:将包含声音信号的数据集进行特征提取,得到log‑mel频谱图的数据集,并将其分为训练集、测试集和验证集;建立三分支特征融合网络模型,所述的三分支特征融合网络模型包括三分支采样、特征提取、三分支的特征融合和损失融合:将测试集和验证集作为训练后的模型的输入,该模型的输出即为该数据集的声音事件检测的结果,包括该音频所包含的声音事件类别和发生该事件的起始和终止时间。本发明通过三分支融合的方式获取到尾部类和难区分类别的判别性特征,并在一定程度上均衡了分类器的类别权重,提高了声音事件检测的效果。

    基于双分支判别特征神经网络的声音事件检测方法

    公开(公告)号:CN114881212B

    公开(公告)日:2024-09-06

    申请号:CN202210490907.5

    申请日:2022-05-07

    Applicant: 天津大学

    Inventor: 谢宗霞 周雨馨

    Abstract: 本发明公开了一种基于双分支判别特征神经网络的声音事件检测方法,包括:将包含声音信号的数据集进行特征提取,得到log‑mel频谱图的数据集,并将其分为训练集、测试集和验证集;建立双分支判别特征网络模型,所述的双分支判别特征网络模型包括双分支采样、特征提取、双分支的特征融合和损失融合:将测试集和验证集作为训练后的模型的输入,该模型的输出即为该数据集的声音事件检测的结果,包括该音频所包含的声音事件类别和发生该事件的起始和终止时间。本发明通过双分支判别特征融合的方式获取到尾部类和难区分类别的判别性特征,并在一定程度上均衡了分类器的类别权重,提高了声音事件检测的效果。

    基于双分支判别特征神经网络的声音事件检测方法

    公开(公告)号:CN114881212A

    公开(公告)日:2022-08-09

    申请号:CN202210490907.5

    申请日:2022-05-07

    Applicant: 天津大学

    Inventor: 谢宗霞 周雨馨

    Abstract: 本发明公开了一种基于双分支判别特征神经网络的声音事件检测方法,包括:将包含声音信号的数据集进行特征提取,得到log‑mel频谱图的数据集,并将其分为训练集、测试集和验证集;建立双分支判别特征网络模型,所述的双分支判别特征网络模型包括双分支采样、特征提取、双分支的特征融合和损失融合:将测试集和验证集作为训练后的模型的输入,该模型的输出即为该数据集的声音事件检测的结果,包括该音频所包含的声音事件类别和发生该事件的起始和终止时间。本发明通过双分支判别特征融合的方式获取到尾部类和难区分类别的判别性特征,并在一定程度上均衡了分类器的类别权重,提高了声音事件检测的效果。

    基于三分支特征融合神经网络的声音事件检测方法

    公开(公告)号:CN114881213B

    公开(公告)日:2024-09-06

    申请号:CN202210490937.6

    申请日:2022-05-07

    Applicant: 天津大学

    Inventor: 谢宗霞 周雨馨

    Abstract: 本发明公开了一种基于三分支特征融合神经网络的声音事件检测方法,包括:将包含声音信号的数据集进行特征提取,得到log‑mel频谱图的数据集,并将其分为训练集、测试集和验证集;建立三分支特征融合网络模型,所述的三分支特征融合网络模型包括三分支采样、特征提取、三分支的特征融合和损失融合:将测试集和验证集作为训练后的模型的输入,该模型的输出即为该数据集的声音事件检测的结果,包括该音频所包含的声音事件类别和发生该事件的起始和终止时间。本发明通过三分支融合的方式获取到尾部类和难区分类别的判别性特征,并在一定程度上均衡了分类器的类别权重,提高了声音事件检测的效果。

Patent Agency Ranking