-
公开(公告)号:CN115376520A
公开(公告)日:2022-11-22
申请号:CN202211030037.X
申请日:2022-08-26
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种用于声纹安全认证系统的重放语音攻击检测方法。首先将语音信号经过预处理,然后通过线性等宽的Gabor滤波器获得若干子带信号,将每个子带信号通过FDEO来获得瞬时幅度和瞬时频率,然后分别作为SENet的输入,得到增强后的IACC和IFCC特征,并且分别经过加窗取平均和离散余弦变换处理获得各自的低维特征向量。然后将提取的IACC和IFCC特征向量分别用来训练各自的高斯混合模型分类器,得到各自的分类器模型参数。在检测时,将待测语音的IACC和IFCC特征向量分别输入到各自的GMM分类器并进行可信度打分,最后进行分数级融合,以此实现真伪语音的判别。
-
公开(公告)号:CN114355411A
公开(公告)日:2022-04-15
申请号:CN202111585075.7
申请日:2021-12-22
Applicant: 杭州电子科技大学
Abstract: 本发明描述了一种基于北斗或GPS导航系统卫星载噪比观测值的洪水探测方法,属于导航卫星反演技术领域。发明提出一种基于北斗/GPS导航卫星系统载噪比观测值的洪水探测方法:第一步:在模型建立层面。第二步:基于载噪比观测值的直接探测法。第三步:基于载噪比相位差与土壤湿度关联模型的间接探测法。第四步:对洪水探测结果分析处理。采用本发明所述方法,既避免了传统地面观测站因站点分布少,密度不均匀,时空分辨率低等问题而导致的洪水探测精度低和探测范围小的缺陷,同时避免了基于遥感卫星雷达站方法建设成本高和建设周期长,且需专用接收机设备进行探测的缺陷。
-
公开(公告)号:CN113506583A
公开(公告)日:2021-10-15
申请号:CN202110718049.0
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明涉及语音识别领域,尤其涉及一种利用残差网络的伪装语音检测方法。包括以下步骤,S1:利用特征提取模块对语音信号x(n)进行处理后得到基于调制频谱的语音特征‑常Q调制包络;S2:将提取出来的常Q调制包络特征以Q调制包络特征图的形式输出,经预处理后输入到改进后的ResNet分类网络中;S3:Q调制包络特征以图片的形式输入到分类网络中后,首先通过1个7×7卷积层和一个3×3池化层,然后通过16个残差单元实现深度特征提取;S4:经过16个残差单元后,通过平均池化层,最终通过全连接层和Softmax层输出语音分类。本发明通过常数Q变换与采用改进残差网络,提高了伪装语音检测的准确性。
-
公开(公告)号:CN113436646A
公开(公告)日:2021-09-24
申请号:CN202110648176.8
申请日:2021-06-10
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种采用联合特征与随机森林的伪装语音检测方法,包括以下步骤:S1、从训练语音库中随机选取真语音和伪语音,分别对随机选取的各语音进行LBP局部纹理特征和CQCC声学特征的提取,并将LBP局部纹理特征和CQCC声学特征联合组成联合特征向量,以得到训练数据集;S2、利用训练数据集对随机森林进行训练,以生成随机森林分类器;S3、将待测语音进行LBP局部纹理特征和CQCC声学特征的提取,并将LBP局部纹理特征和CQCC声学特征联合组成待测联合特征向量,将待测联合特征向量输入随机森林分类器以对待测语音进行真伪检测。本发明对待测语音进行真伪检测,有效提升ASV系统的安全性。
-
公开(公告)号:CN107785030B
公开(公告)日:2021-04-30
申请号:CN201710971228.9
申请日:2017-10-18
Applicant: 杭州电子科技大学
Abstract: 本发明提供一种语音转换方法,包括下列步骤:S1:提取语音资料中音源与目标音的语音特征;S2:对音源与目标音的语音信息进行动态时间规整;S3:运用高斯混合模型与聚类算法训练规整后的语音;S4:提取音源的语音信息并将其用训练后所得的数据进行转换,合成为目标音。本发明提供了一种精确高效的实现将音源的声音变换为目标音的声音的方法,可以根据源和目标说话人的说话的数学特点,通过对二者语音进行建模并进行算法运算,将源说话人的语音准确转化为目标说话人的语音。
-
公开(公告)号:CN112259086A
公开(公告)日:2021-01-22
申请号:CN202011102941.8
申请日:2020-10-15
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于语谱图合成的语音转换方法,包括:S1.将源语音和目标语音的语谱图分解为内容语谱图和说话人语谱图,并将内容语谱图和说话人语谱图分别输入超深度卷积神经网络中进行处理,分别得到语义内容信息和说话人身份信息;S2.将得到的语义内容信息和说话人身份信息映射到特征空间,分别得到语义内容信息和说话人身份信息的特征矩阵直方图;S3.将得到的语义内容信息和说话人身份信息的特征矩阵直方图输入直方图匹配HdaIN层中进行匹配,得到目标特征矩阵;S4.基于生成框架将得到的目标特征矩阵转换为目标语谱图;S5.将转换得到的目标语谱图通过生成对抗网络转换为语音波形输出。
-
公开(公告)号:CN109239744B
公开(公告)日:2020-10-09
申请号:CN201811221034.8
申请日:2018-10-19
Applicant: 杭州电子科技大学
IPC: G01S19/30
Abstract: 本发明主要公开了一种基于复信号相位的快速抗比特反转快速捕获方法,通过对接收信号进行下变频处理,并对本地相关信号和接收信号进行分块,将得到矩的阵进行码相位搜索处理,得到待检测变量,再通过相干积分检测,得到码相位搜索处理的相干积分值,对接收信号进行码相位处理得到码相位处理待检测变量,得出的估算的比特数据反转位置,再进行相干积分检测,最后得到待求参数码相位,最终获得估计的捕获参数码相位和频率,从而实现了GNSS信号的快速捕获。本发明方法可以快速精确估计码相位,从而实现比特符号反转情况下捕获参数估计。
-
公开(公告)号:CN111599368A
公开(公告)日:2020-08-28
申请号:CN202010417945.9
申请日:2020-05-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于直方图匹配的自适应实例规一化语音转换方法,包括:S11.将源语音和目标语音分别输入至编码器中进行编码处理,分别得到语音内容信息和说话人信息;S12.将得到的语音内容信息和说话人信息分别输入自适应实例规一化AdaIN中进行均值和方差的对齐处理;S13.将经过自适应实例规一化AdaIN处理后的语音内容信息和说话人信息通过解码器进行解码,得到解码后的转换语音;S14.将解码后的转换语音输入直方图匹配算法中进行处理,得到最终转换后的语音。本发明将语音的内容信息与说话人信息分开处理,并用直方图进行匹配优化,从而达到训练一个模型完成一对多的语音转换的目的。
-
公开(公告)号:CN110148425A
公开(公告)日:2019-08-20
申请号:CN201910396609.8
申请日:2019-05-14
Applicant: 杭州电子科技大学
Abstract: 本发明涉及基于完整局部二进制模式的伪装语音检测方法,包括:对真实语音库和相应的伪装语音库中所有语音进行变量Q变换,得到所有真实语音和伪装语音的语谱图;分别将各语谱图转换为相应的灰度图像,并采用完整局部二进制模式处理,生成相应的纹理特征;将所有的纹理特征作为训练支持向量机的训练集,训练得到支持向量机;将待识别语音输入至支持向量机,以进行伪装语音的识别。本发明采用变量Q变换获取的语谱图,纹理更加清晰,有助于提取语音信号的纹理特征;而且采用完整局部二进制模式,包含语谱图的局部符号差值信息和局部幅度差值信息,可更全面地获取信号的纹理特征,有利于支持向量机的分类,提高识别伪装语音的准确率。
-
公开(公告)号:CN110010137A
公开(公告)日:2019-07-12
申请号:CN201910272145.X
申请日:2019-04-04
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于张量结构及稀疏表示的说话人确认方法及系统,该方法包括步骤:S1、构建听觉特征张量;S2、将所述听觉特征张量转换成稀疏矩阵;S3、降低所述稀疏矩阵的维度以生成最终的特征向量;S4、基于稀疏表示分类器进行说话人确认。本发明能够在保留数据的内在结构的基础上,减少计算的复杂度,提高说话人确认效率。
-
-
-
-
-
-
-
-
-