一种基于经典-量子混合网络的说话人识别方法

    公开(公告)号:CN116469393A

    公开(公告)日:2023-07-21

    申请号:CN202310425818.7

    申请日:2023-04-20

    Applicant: 南昌大学

    Inventor: 张烨 许程本

    Abstract: 本发明提供了一种基于经典‑量子混合网络的说话人识别方法。该方法首先利用卷积神经网络提取到说话人语音信号的深度特征,然后利用量子神经网络计算该深度特征的概率分布,将所得到的概率分布与深度特征点乘构建说话人的融合特征,利用该融合特征输入到说话人识别网络中实现说话人识别。本发明采用卷积神经网络和量子神经网络相结合构成一个新的说话人识别模型,该模型利用量子神经网络所提取的概率分布可以自适应地分配某卷积层不同通道的注意力权重,从而对不同通道的语音特征图进行加权,增强包含较多说话人话语特征信息的重要性,使得混合神经网络提取的说话人话语深度特征表示更有利于说话人识别,从而提高说话人识别的性能。

    一种基于经典-量子混合网络的说话人识别方法

    公开(公告)号:CN116469393B

    公开(公告)日:2024-08-02

    申请号:CN202310425818.7

    申请日:2023-04-20

    Applicant: 南昌大学

    Inventor: 张烨 许程本

    Abstract: 本发明提供了一种基于经典‑量子混合网络的说话人识别方法。该方法首先利用卷积神经网络提取到说话人语音信号的深度特征,然后利用量子神经网络计算该深度特征的概率分布,将所得到的概率分布与深度特征点乘构建说话人的融合特征,利用该融合特征输入到说话人识别网络中实现说话人识别。本发明采用卷积神经网络和量子神经网络相结合构成一个新的说话人识别模型,该模型利用量子神经网络所提取的概率分布可以自适应地分配某卷积层不同通道的注意力权重,从而对不同通道的语音特征图进行加权,增强包含较多说话人话语特征信息的重要性,使得混合神经网络提取的说话人话语深度特征表示更有利于说话人识别,从而提高说话人识别的性能。

Patent Agency Ranking