-
公开(公告)号:CN116259313A
公开(公告)日:2023-06-13
申请号:CN202310245354.1
申请日:2023-03-14
Applicant: 桂林理工大学
Abstract: 本发明提供一种基于时域卷积网络的声音事件定位和检测方法,该方法采用了TCN层来增强模型对长期时间和空间信息的建模能力,同时可以实现同时进行声音事件检测和声音事件定位,减少了算法复杂度和计算量,使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数,提高了模型的泛化能力和稳定性。
-
公开(公告)号:CN116631386A
公开(公告)日:2023-08-22
申请号:CN202310245365.X
申请日:2023-03-14
Applicant: 桂林理工大学
Abstract: 本发明提供一种基于融合通道注意力机制的残差模块的声音事件定位与识别方法,该方法采用了SE残差块对网络的特征提取能力和空间信息的融合进行了改进,同时可以实现同时进行声音事件检测和声音事件定位,减少了算法复杂度和计算量,使用联合训练的方法优化了声音事件检测和声音事件定位任务的损失函数,提高了模型的泛化能力和稳定性。
-