一种基于交叉门控并行卷积网络的说话人辨识方法

    公开(公告)号:CN114822555A

    公开(公告)日:2022-07-29

    申请号:CN202210316425.8

    申请日:2022-03-29

    Applicant: 南昌大学

    Inventor: 张烨 张嘉城

    Abstract: 本发明提供了一种基于交叉门控并行卷积网络的说话人辨识方法。首先利用多层交叉门控并行卷积网络对两种不同类型的语音特征进行处理,提取出两个深度特征;然后,拼接两个深度特征并输入卷积神经网络,提取融合特征;最后,将融合特征输入分类网络,实现说话人辨识。本发明基于交叉门控并行卷积网络,实现了对两种不同类型的语音特征的处理,采用交叉门控机制,增强了并行网络中两条并行支路之间的信息交互能力,配合以特征拼接操作和卷积神经网络,实现了有效的特征融合,并提升了说话人辨识系统的性能。

    一种基于解析稀疏表示与压缩感知的图像加密算法

    公开(公告)号:CN106056526A

    公开(公告)日:2016-10-26

    申请号:CN201610356504.6

    申请日:2016-05-26

    Applicant: 南昌大学

    CPC classification number: G06T1/00 G06T9/00

    Abstract: 一种基于解析稀疏表示与压缩感知的图像加密算法,利用解析稀疏模型对原图像进行解析稀疏表示;然后利用压缩感知对解析稀疏系数进行压缩采样,最终得到加密图像。本发明在构造解析稀疏模型时采用的字典,采用logistic混沌进行原子位置置乱;压缩感知的测量矩阵是由logistic混沌生成的初始行循环得到的。本发明提高了稀疏表示对图像的表示性能,在进行解密时,能够更好的恢复得到原图像;将压缩感知应用于图像加密,使的图像加密和数据压缩能够同时进行;与将压缩感知中整个测量矩阵作为密钥的方法相比,本发明在具有高密钥敏感度的同时大大缩短了密钥的长度。本发明具有很高的安全性和数据压缩性能。

    一种基于交叉门控并行卷积网络的说话人辨识方法

    公开(公告)号:CN114822555B

    公开(公告)日:2024-11-26

    申请号:CN202210316425.8

    申请日:2022-03-29

    Applicant: 南昌大学

    Inventor: 张烨 张嘉城

    Abstract: 本发明提供了一种基于交叉门控并行卷积网络的说话人辨识方法。首先利用多层交叉门控并行卷积网络对两种不同类型的语音特征进行处理,提取出两个深度特征;然后,拼接两个深度特征并输入卷积神经网络,提取融合特征;最后,将融合特征输入分类网络,实现说话人辨识。本发明基于交叉门控并行卷积网络,实现了对两种不同类型的语音特征的处理,采用交叉门控机制,增强了并行网络中两条并行支路之间的信息交互能力,配合以特征拼接操作和卷积神经网络,实现了有效的特征融合,并提升了说话人辨识系统的性能。

    一种基于多通道卷积神经网络和多任务学习的共信道说话人识别方法

    公开(公告)号:CN116665677A

    公开(公告)日:2023-08-29

    申请号:CN202310425774.8

    申请日:2023-04-20

    Applicant: 南昌大学

    Inventor: 张烨 冯克轩

    Abstract: 本发明提供了一种基于多通道卷积神经网络和多任务学习的共信道说话人识别方法。利用说话人分离网络估计出混合语音中的每个说话人的语音信号,对估计出的语音信号进行分段,对每段语音信号采用不同的SincNet滤波器提取各段的语音信号特征向量。聚合所有段的特征向量,在时间维度上计算出其均值和标准差,合并构成话语级特征,通过深度神经网络实现说话人的识别。利用估计语音与干净语音之间的尺度不变信噪比损失以及预测标签与真实标签之间的分类交叉熵损失,采用多任务学习算法联合优化整体网络,实现说话人的分离和识别。

    一种基于解析稀疏表示的图像盲分离方法

    公开(公告)号:CN105354807B

    公开(公告)日:2019-03-01

    申请号:CN201510815145.1

    申请日:2015-11-23

    Applicant: 南昌大学

    Abstract: 一种基于解析稀疏表示的图像盲分离方法,首先利用图像信号的解析稀疏先验,采用子集追踪算法,通过学习得到源图像的解析字典;然后利用Bregman距离作为目标函数,采用分裂Bregman算法进行恢复源信号;再利用最小二乘法来估计混合系统,循环进行以上三个步骤得到最终源图像。本发明为学习字典提供了比较快速有效的方法;将分裂Bregman算法应用于源信号的恢复中,加快了算法的迭代速度;通过对解析字典、源信号和混合矩阵的迭代估计过程,得到最优的分离结果,这个迭代过程提高了分离的有效性。在无线电通信、雷达与声纳信号处理、医学图像分析、图像信号处理以及语音识别等领域均有广泛的应用。

    一种基于经典-量子混合网络的说话人识别方法

    公开(公告)号:CN116469393B

    公开(公告)日:2024-08-02

    申请号:CN202310425818.7

    申请日:2023-04-20

    Applicant: 南昌大学

    Inventor: 张烨 许程本

    Abstract: 本发明提供了一种基于经典‑量子混合网络的说话人识别方法。该方法首先利用卷积神经网络提取到说话人语音信号的深度特征,然后利用量子神经网络计算该深度特征的概率分布,将所得到的概率分布与深度特征点乘构建说话人的融合特征,利用该融合特征输入到说话人识别网络中实现说话人识别。本发明采用卷积神经网络和量子神经网络相结合构成一个新的说话人识别模型,该模型利用量子神经网络所提取的概率分布可以自适应地分配某卷积层不同通道的注意力权重,从而对不同通道的语音特征图进行加权,增强包含较多说话人话语特征信息的重要性,使得混合神经网络提取的说话人话语深度特征表示更有利于说话人识别,从而提高说话人识别的性能。

    一种基于独立向量分析的语音特征融合的说话人识别方法

    公开(公告)号:CN113793614B

    公开(公告)日:2024-02-09

    申请号:CN202110972388.1

    申请日:2021-08-24

    Applicant: 南昌大学

    Inventor: 张烨 马彪

    Abstract: 本发明提供了一种基于独立向量分析的语音特征融合的说话人识别方法。该方法首先将语音信号的时域特征和频域特征分别构成时域特征矩阵和频域特征矩阵。然后,将时域特征矩阵和频域特征矩阵构成一个特征张量。利用独立向量分析,从此特征张量中提取融合特征,建立说话人模型,实现说话人的识别。本发明采用独立向量分析将语音信号的时域特征和频域特征融合,构成一个新的语音信号的融合特征和说话人的模型,可增强不同类特征之间的相关性,同时减小同类特征之间的冗余性,提高说话人识别系统的性能。

    测量矩阵受控的图像压缩感知与图像加密方法

    公开(公告)号:CN102833514B

    公开(公告)日:2016-02-24

    申请号:CN201210278335.0

    申请日:2012-08-07

    Applicant: 南昌大学

    Abstract: 一种测量矩阵受密钥控制的图像压缩感知与图像加密方法,将压缩感知应用于图像加密,利用循环矩阵构造测量矩阵,然后通过混沌系统构造循环矩阵的初始向量,实现测量矩阵受密钥控制;根据混沌系统对初值的敏感性,将混沌系统的初始值作为密钥。本发明将过程中,图像压缩和图像加密同时完成,具有较高的安全性。

    一种基于压缩感知的联合图像压缩/加密方法

    公开(公告)号:CN102891999B

    公开(公告)日:2014-11-26

    申请号:CN201210361052.2

    申请日:2012-09-26

    Applicant: 南昌大学

    Abstract: 一种基于压缩感知的联合图像压缩/加密方法,首先,字典由结合K-SVD方法分类训练得到的子字典联合构成;其次,稀疏编码中采用改进的正交匹配追踪算法;最后,将加密嵌入到压缩过程中,从而实现了图像的联合加密/压缩算法。本发明使加密和压缩密不可分,从而在基本不影响率失真性能的前提下,进一步改进了系统抗攻击性能和稳健性,实现的静态图像压缩的率失真性能优于目前国际上的主流算法如JPEG2000、SPIHT等,同时又增加了图像加密性能,能抵御常见的攻击如惟密文攻击、选择密文攻击,已知明文攻击和选择明文攻击等,本发明可用于信息安全传输领域如互联网、移动电话和视频会议的图像存储和传输中。

    一种基于解析稀疏表示的图像去噪方法

    公开(公告)号:CN103606133B

    公开(公告)日:2016-08-17

    申请号:CN201310544290.1

    申请日:2013-11-06

    Applicant: 南昌大学

    Abstract: 一种基于解析稀疏表示的图像去噪方法,首先利用带噪图像通过子集追踪算法学习得到解析字典,然后利用Bregman距离作为目标函数,采用加权分裂Bregman算法进行源信号的估计,得到最终的去噪图像,达到图像去噪的目的。本发明提供的图像去噪方法能提高图像的质量、提供更加准确的目标和背景信息,达到较理想的去噪效果,在目标检测、光学成像、安全监控系统等军事领域和非军事领域均有广泛的应用。

Patent Agency Ranking