-
公开(公告)号:CN113012714A
公开(公告)日:2021-06-22
申请号:CN202110197042.9
申请日:2021-02-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于像素注意力机制胶囊网络模型的声学事件检测方法,包括如下步骤:(1)对原始音频数据进行预处理;(2)提出构建像素注意力机制胶囊网络‑双向门控循环单元网络(Pixel‑Based Attention of Capsule Network‑Bidirectional Gated Recurrent Unit,PBAttCapsNet‑BGRU)模型;(3)完成基于像素注意力机制胶囊网络模型的声学事件检测任务。本发明为了取得对不连续、重叠声学事件较好的检测效果,提出一种基于像素注意力机制胶囊网络模型的声学事件检测方法。通过与其他声学事件检测方法的性能对比,本发明提出的基于像素注意力机制胶囊网络模型的声学事件检测方法能够有效地对不连续、重叠声学事件进行检测,并提升检测性能。
-
公开(公告)号:CN116501908B
公开(公告)日:2024-04-26
申请号:CN202310546775.8
申请日:2023-05-16
Applicant: 哈尔滨工程大学
IPC: G06F16/583 , G06V10/80 , G06V10/82 , G06V10/74 , G06V10/774 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084 , G06N3/096
Abstract: 本发明公开了一种基于特征融合可学习图注意力网络的图像检索方法,具体包括以下步骤:获取原始图像数据和原始点云数据;基于所述原始图像数据和所述原始点云数据,获取图像特征向量和点云特征向量;构建基于特征融合可学习图注意力网络模型,利用所述图像特征向量和所述点云特征向量训练所述特征融合可学习图注意力网络模型;利用所述基于特征融合可学习图注意力网络模型进行图像检索,完成基于特征融合课学习图注意力网络的图像检索。本发明提出的基于特征融合可学习图注意力网络的图像检索方法,在识别精度、任务适应性和抗噪鲁棒性上有较好的表现,具有一定的有效性。
-
公开(公告)号:CN113012714B
公开(公告)日:2022-08-02
申请号:CN202110197042.9
申请日:2021-02-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于像素注意力机制胶囊网络模型的声学事件检测方法,包括如下步骤:(1)对原始音频数据进行预处理;(2)提出构建像素注意力机制胶囊网络‑双向门控循环单元网络(Pixel‑Based Attention of Capsule Network‑Bidirectional Gated Recurrent Unit,PBAttCapsNet‑BGRU)模型;(3)完成基于像素注意力机制胶囊网络模型的声学事件检测任务。本发明为了取得对不连续、重叠声学事件较好的检测效果,提出一种基于像素注意力机制胶囊网络模型的声学事件检测方法。通过与其他声学事件检测方法的性能对比,本发明提出的基于像素注意力机制胶囊网络模型的声学事件检测方法能够有效地对不连续、重叠声学事件进行检测,并提升检测性能。
-
公开(公告)号:CN116501908A
公开(公告)日:2023-07-28
申请号:CN202310546775.8
申请日:2023-05-16
Applicant: 哈尔滨工程大学
IPC: G06F16/583 , G06V10/80 , G06V10/82 , G06V10/74 , G06V10/774 , G06N3/042 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/084 , G06N3/096
Abstract: 本发明公开了一种基于特征融合可学习图注意力网络的图像检索方法,具体包括以下步骤:获取原始图像数据和原始点云数据;基于所述原始图像数据和所述原始点云数据,获取图像特征向量和点云特征向量;构建基于特征融合可学习图注意力网络模型,利用所述图像特征向量和所述点云特征向量训练所述特征融合可学习图注意力网络模型;利用所述基于特征融合可学习图注意力网络模型进行图像检索,完成基于特征融合课学习图注意力网络的图像检索。本发明提出的基于特征融合可学习图注意力网络的图像检索方法,在识别精度、任务适应性和抗噪鲁棒性上有较好的表现,具有一定的有效性。
-
公开(公告)号:CN112908341B
公开(公告)日:2023-01-03
申请号:CN202110197641.0
申请日:2021-02-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于多任务自注意力机制的语言学习者声纹识别方法。包括如下步骤:(1)对原始语音信号进行预处理;(2)提出构建多任务自注意力网络(Multi‑Task Self‑Attention Network,MT‑SANet)模型;(3)提出从新的角度将学习语言过程中的不同学习阶段纳入辅助任务;(4)完成基于多任务自注意力机制的语言学习者声纹识别。本发明为了取得更好的语言学习者的声纹识别效果,提出一种基于多任务自注意力机制的语言学习者声纹识别方法。本发明提出的基于多任务自注意力机制的语言学习者声纹识别方法,能更好的提高声纹识别的正确率和泛化能力,具有一定的有效性。
-
公开(公告)号:CN112908341A
公开(公告)日:2021-06-04
申请号:CN202110197641.0
申请日:2021-02-22
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于多任务自注意力机制的语言学习者声纹识别方法。包括如下步骤:(1)对原始语音信号进行预处理;(2)提出构建多任务自注意力网络(Multi‑Task Self‑Attention Network,MT‑SANet)模型;(3)提出从新的角度将学习语言过程中的不同学习阶段纳入辅助任务;(4)完成基于多任务自注意力机制的语言学习者声纹识别。本发明为了取得更好的语言学习者的声纹识别效果,提出一种基于多任务自注意力机制的语言学习者声纹识别方法。本发明提出的基于多任务自注意力机制的语言学习者声纹识别方法,能更好的提高声纹识别的正确率和泛化能力,具有一定的有效性。
-
-
-
-
-