-
公开(公告)号:CN111161715A
公开(公告)日:2020-05-15
申请号:CN201911363277.X
申请日:2019-12-25
Applicant: 福州大学
Abstract: 本发明涉及一种基于序列分类的特定声音事件检索与定位的方法,通过利用声音的时序性和注意力机制关注重要的上下文信息以提取特定目标声音事件的声音深层特征,再通过多任务学习联合回归损失和分类损失来训练特定声音事件检索网络。给定音频文件进行特定音频事件检索和定位时,首先,将待测声音片段的梅尔特征能量输入到声音检索模型中,得到每个声音片段的特定声音事件的检索结果,再通过后处理定位特定声音事件出现的起止音频帧,最后通过平滑处理得到音频文件完整的特定声音事件检索和定位信息。
-
公开(公告)号:CN111161715B
公开(公告)日:2022-06-14
申请号:CN201911363277.X
申请日:2019-12-25
Applicant: 福州大学
Abstract: 本发明涉及一种基于序列分类的特定声音事件检索与定位的方法,通过利用声音的时序性和注意力机制关注重要的上下文信息以提取特定目标声音事件的声音深层特征,再通过多任务学习联合回归损失和分类损失来训练特定声音事件检索网络。给定音频文件进行特定音频事件检索和定位时,首先,将待测声音片段的梅尔特征能量输入到声音检索模型中,得到每个声音片段的特定声音事件的检索结果,再通过后处理定位特定声音事件出现的起止音频帧,最后通过平滑处理得到音频文件完整的特定声音事件检索和定位信息。
-