-
公开(公告)号:CN114355411B
公开(公告)日:2023-07-25
申请号:CN202111585075.7
申请日:2021-12-22
Applicant: 杭州电子科技大学
Abstract: 本发明描述了一种基于北斗或GPS导航系统卫星载噪比观测值的洪水探测方法,属于导航卫星反演技术领域。发明提出一种基于北斗/GPS导航卫星系统载噪比观测值的洪水探测方法:第一步:在模型建立层面。第二步:基于载噪比观测值的直接探测法。第三步:基于载噪比相位差与土壤湿度关联模型的间接探测法。第四步:对洪水探测结果分析处理。采用本发明所述方法,既避免了传统地面观测站因站点分布少,密度不均匀,时空分辨率低等问题而导致的洪水探测精度低和探测范围小的缺陷,同时避免了基于遥感卫星雷达站方法建设成本高和建设周期长,且需专用接收机设备进行探测的缺陷。
-
公开(公告)号:CN115376533A
公开(公告)日:2022-11-22
申请号:CN202210978891.2
申请日:2022-08-16
Applicant: 杭州电子科技大学
IPC: G10L21/013 , G10L19/16
Abstract: 本发明使用基于音素的信息瓶颈来表征说话人风格和控制转换语音的速度,由内容编码器、说话人编码器、音素时长转换器、解码器和声码器组成。通过编码器和解码器之间的信息瓶颈从源语音中分离出内容信息,并将其与目标说话人嵌入一起输入解码器,最后输入声码器并生成转换后的语音。本发明通过引入持续时长转换器,利用设计好的音素级信息瓶颈来分离说话人内容信息和说话人风格信息,可以适用于零次学习,对训练数据集外的语音也同样适用。
-
公开(公告)号:CN111599368B
公开(公告)日:2022-10-18
申请号:CN202010417945.9
申请日:2020-05-18
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于直方图匹配的自适应实例规一化语音转换方法,包括:S11.将源语音和目标语音分别输入至编码器中进行编码处理,分别得到语音内容信息和说话人信息;S12.将得到的语音内容信息和说话人信息分别输入自适应实例规一化AdaIN中进行均值和方差的对齐处理;S13.将经过自适应实例规一化AdaIN处理后的语音内容信息和说话人信息通过解码器进行解码,得到解码后的转换语音;S14.将解码后的转换语音输入直方图匹配算法中进行处理,得到最终转换后的语音。本发明将语音的内容信息与说话人信息分开处理,并用直方图进行匹配优化,从而达到训练一个模型完成一对多的语音转换的目的。
-
公开(公告)号:CN114582363A
公开(公告)日:2022-06-03
申请号:CN202210156203.4
申请日:2022-02-21
Applicant: 杭州电子科技大学
IPC: G10L21/007 , G10L25/24 , G10L25/30
Abstract: 本发明用于非平行语料的语音转换方法:(1)获取源说话人的语音数据库,提取源说话人的Mel谱图x,作为转换用的语音特征;(2)创建与源说话人Mel谱图x大小相同的时间掩码m,将m加到x上,填补x上缺少的帧,得到x′;(3)提取源说话人的基音频率F0,将F0经对数高斯归一化变换转换成目标说话人的基频F0′;(4)训练CycleGAN模型,在对抗损失中加入梯度惩罚;(5)变化总体目标函数;(6)将(2)、(3)得到的x′、基频F0′和创建的时间掩码m一起输入生成器GX→Y中,F0′作为辅助特征,调整Mel谱图的转换方向,生成器将x′转换成目标语音的Mel谱图y′;(7)把得到的转换Mel谱图y′馈入声码器中合成语音波形,获得与目标说话人相似的语音。
-
公开(公告)号:CN114283849A
公开(公告)日:2022-04-05
申请号:CN202111612756.8
申请日:2021-12-27
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种伪装语音检测系统及方法,系统包括如下:纹理分析模块:用于提取训练语音和评估语音的CSLBP特征向量,并将CSLBP特征向量输入随机森林分类器;随机森林分类器:根据纹理分析模块输入的训练语音的CSLBP特征向量进行训练得到分类模型;进行伪装语音检测时,经纹理分析模块处理的评估语音的CSLBP特征向量输入到分类模型中即可判别语音真伪。本发明根据真伪语音的纹理差异,提取语音信号的CSLBP特征做特征向量,不仅利用了语谱图中像素点的灰度值大小信息,还利用了各像素点的空间位置信息,与传统LBP特征相比包含的纹理信息更加丰富,提高了伪装语音检测的准确性。
-
公开(公告)号:CN112201258A
公开(公告)日:2021-01-08
申请号:CN202011102336.0
申请日:2020-10-15
Applicant: 杭州电子科技大学
Abstract: 本发明公开了一种基于AMBP的噪声鲁棒性伪装语音检测方法,包括:S11.将含噪声的语音转换为语谱图;S12.采用自适应中位数二进制模式AMBP算法对语谱图进行特征提取,得到语音的纹理特征向量;S13.利用得到的语音纹理特征向量训练支持向量机,得到语音分类模型,并利用语音分类模型对语音进行检测分类,得到分类结果。本发明大大提高了伪装语音检测的效果。
-
公开(公告)号:CN108766450A
公开(公告)日:2018-11-06
申请号:CN201810335633.6
申请日:2018-04-16
Applicant: 杭州电子科技大学
CPC classification number: G10L19/02 , G10L13/02 , G10L15/063
Abstract: 本发明提出一种基于谐波冲激分解的语音转换方法,包括如下步骤:S1,将语音信号分解成谐波信号和冲激信号;S2,将所述谐波信号进行语音转换,形成目标谐波信号;S3,将所述目标谐波信号与所述冲激信号进行叠加,形成目标语音信号。本发明采用谐波冲激分解模型对语音信号进行分解,将语音信号分解成谐波信号部分和冲激信号部分,仅对谐波信号部分做频谱分解和稀疏表示,不对冲激信号做任何处理,既能够保证信息的完全性、又可以减少信息的丢失,还有利于提高转换后语音的质量,处理过程简单、方便,推广性强,具有较高的应用前景。
-
公开(公告)号:CN119864053A
公开(公告)日:2025-04-22
申请号:CN202510026212.5
申请日:2025-01-08
Applicant: 杭州电子科技大学
Abstract: 本发明涉及一种采用双维度图注意力的伪造语音检测方法,对原始语音进行预加重处理,提取每一帧的线性频率倒谱系数特征;根据线性频率倒谱系数特征并使用BP算法对真实语音和伪造语音进行GMM建模,采用期望最大化算法对训练数据进行迭代运算,直至收敛,统计语音帧数并分别计算每帧语音特征在各个高斯分量的LGP,再减去常数项并进行标准化处理;本发明通过采用双向细分法(BP)对高斯混合模型进行建模,使相邻高斯分量的均值向量差异较小,不仅使二维卷积能够有效地捕捉高斯分量之间的依赖关系,为图注意力模块提供更明确、更紧密的特征关系,增强注意力机制对全局特征的表征能力,该方法从局部到全局优化特征空间结构,提升伪造语音检测的性能。
-
公开(公告)号:CN113506583B
公开(公告)日:2024-01-05
申请号:CN202110718049.0
申请日:2021-06-28
Applicant: 杭州电子科技大学
Abstract: 本发明涉及语音识别领域,尤其涉及一种利用残差网络的伪装语音检测方法。包括以下步骤,S1:利用特征提取模块对语音信号x(n)进行处理后得到基于调制频谱的语音特征‑常Q调制包络;S2:将提取出来的常Q调制包络特征以Q调制包络特征图的形式输出,经预处理后输入到改进后的ResNet分类网络中;S3:Q调制包络特征以图片的形式输入到分类网络中后,首先通过1个7×7卷积层和一个3×3池化层,然后通过16个残差单元实现深度特征提取;S4:经过16个残差单元后,通过平均池化层,最终通过全连接层和Softmax层输出语音分类。本发明通过常数Q变换与采用改进残差网络,提高了伪装语音检测的准确性。
-
公开(公告)号:CN111613240B
公开(公告)日:2023-06-27
申请号:CN202010439274.6
申请日:2020-05-22
Applicant: 杭州电子科技大学
IPC: G10L25/18 , G10L25/24 , G10L25/45 , G10L25/51 , G06N3/0442 , G06N3/084 , G06F18/2411 , G06N3/048
Abstract: 本发明公开了一种基于注意力机制和Bi‑LSTM的伪装语音检测方法,包括:S1.提取语音样本中与语音相对应的语音特征数据,并将提取出的语音特征数据转换为语音图像数据;S2.采用双向长短期记忆网络Bi‑LSTM对转换得到的语音图像数据进行处理,得到图像数据的深度特征;S3.采用注意力机制对所述得到的深度特征进行计算,得到注意力的概率分布;S4.采用DNN分类器对得到的注意力概率分布进行分类,得到最终的伪装语言检测结果。本发明将提取出来的特征数据转换成图像数据,再将图像数据作为双向长短期记忆网络的输入得到深度特征,然后用注意力模型对深度特征进行计算并得到注意力概率分布,最后用支持向量机模型对输出结果进行分类,得到欺骗检测结果。
-
-
-
-
-
-
-
-
-