基于像素注意力机制胶囊网络模型的声学事件检测方法

    公开(公告)号:CN113012714A

    公开(公告)日:2021-06-22

    申请号:CN202110197042.9

    申请日:2021-02-22

    Abstract: 本发明提供一种基于像素注意力机制胶囊网络模型的声学事件检测方法,包括如下步骤:(1)对原始音频数据进行预处理;(2)提出构建像素注意力机制胶囊网络‑双向门控循环单元网络(Pixel‑Based Attention of Capsule Network‑Bidirectional Gated Recurrent Unit,PBAttCapsNet‑BGRU)模型;(3)完成基于像素注意力机制胶囊网络模型的声学事件检测任务。本发明为了取得对不连续、重叠声学事件较好的检测效果,提出一种基于像素注意力机制胶囊网络模型的声学事件检测方法。通过与其他声学事件检测方法的性能对比,本发明提出的基于像素注意力机制胶囊网络模型的声学事件检测方法能够有效地对不连续、重叠声学事件进行检测,并提升检测性能。

    基于像素注意力机制胶囊网络模型的声学事件检测方法

    公开(公告)号:CN113012714B

    公开(公告)日:2022-08-02

    申请号:CN202110197042.9

    申请日:2021-02-22

    Abstract: 本发明提供一种基于像素注意力机制胶囊网络模型的声学事件检测方法,包括如下步骤:(1)对原始音频数据进行预处理;(2)提出构建像素注意力机制胶囊网络‑双向门控循环单元网络(Pixel‑Based Attention of Capsule Network‑Bidirectional Gated Recurrent Unit,PBAttCapsNet‑BGRU)模型;(3)完成基于像素注意力机制胶囊网络模型的声学事件检测任务。本发明为了取得对不连续、重叠声学事件较好的检测效果,提出一种基于像素注意力机制胶囊网络模型的声学事件检测方法。通过与其他声学事件检测方法的性能对比,本发明提出的基于像素注意力机制胶囊网络模型的声学事件检测方法能够有效地对不连续、重叠声学事件进行检测,并提升检测性能。

    基于多任务自注意力机制的语言学习者声纹识别方法

    公开(公告)号:CN112908341B

    公开(公告)日:2023-01-03

    申请号:CN202110197641.0

    申请日:2021-02-22

    Abstract: 本发明提供的是一种基于多任务自注意力机制的语言学习者声纹识别方法。包括如下步骤:(1)对原始语音信号进行预处理;(2)提出构建多任务自注意力网络(Multi‑Task Self‑Attention Network,MT‑SANet)模型;(3)提出从新的角度将学习语言过程中的不同学习阶段纳入辅助任务;(4)完成基于多任务自注意力机制的语言学习者声纹识别。本发明为了取得更好的语言学习者的声纹识别效果,提出一种基于多任务自注意力机制的语言学习者声纹识别方法。本发明提出的基于多任务自注意力机制的语言学习者声纹识别方法,能更好的提高声纹识别的正确率和泛化能力,具有一定的有效性。

    基于多任务自注意力机制的语言学习者声纹识别方法

    公开(公告)号:CN112908341A

    公开(公告)日:2021-06-04

    申请号:CN202110197641.0

    申请日:2021-02-22

    Abstract: 本发明提供的是一种基于多任务自注意力机制的语言学习者声纹识别方法。包括如下步骤:(1)对原始语音信号进行预处理;(2)提出构建多任务自注意力网络(Multi‑Task Self‑Attention Network,MT‑SANet)模型;(3)提出从新的角度将学习语言过程中的不同学习阶段纳入辅助任务;(4)完成基于多任务自注意力机制的语言学习者声纹识别。本发明为了取得更好的语言学习者的声纹识别效果,提出一种基于多任务自注意力机制的语言学习者声纹识别方法。本发明提出的基于多任务自注意力机制的语言学习者声纹识别方法,能更好的提高声纹识别的正确率和泛化能力,具有一定的有效性。

Patent Agency Ranking