-
公开(公告)号:CN117351940B
公开(公告)日:2024-03-01
申请号:CN202311655426.6
申请日:2023-12-05
Applicant: 中国科学院自动化研究所
IPC: G10L15/01 , G10L15/06 , G10L15/16 , G10L15/183
Abstract: 本发明涉及一种基于语音大模型的合成语音检测方法及装置,基于语音大模型的合成语音检测方法包括:对每一语音合成算法对应的样本语音进行多鉴别任务的标签标记,构建鉴别任务序列;遍历每一语音合成算法,获取该语音合成算法对应的样本语音的梅尔谱,输入基于前一语音合成算法对应的语音训练模型的编码器,得到隐变量;将隐变量及鉴别任务序列输入基于前一语音合成算法对应的语音训练模型的解码器,获取预测鉴别值;依据预测鉴别值及实际鉴别值,对前一语音合成算法对应的语音训练模型的模型参数值矩阵进行梯度方向优化,在所有合成语音算法遍历完毕后,得到语音大模型。可以提升合成语音检测效率。
-
公开(公告)号:CN117292694B
公开(公告)日:2024-02-27
申请号:CN202311564716.X
申请日:2023-11-22
Applicant: 中国科学院自动化研究所
Abstract: 本发明实施例涉及一种基于时不变编码的少令牌神经语音编解码方法和系统,应用于训练好的神经语音编解码模型,该神经语音编解码模型包括编码器、时不变提取器、量化器和解码器;基于所述编码器对待处理语音进行编码,获得编码器输出层的隐层表示及编码器中间层的中间层表示;基于所述时不变提取器对所述中间层表示进行时不变特征提取,获得时不变表示;基于所述量化器分别对所述隐层表示和时不变表示进行量化,获得帧级别语音令牌和时不变令牌;基于所述解码器对所述帧级别语音令牌和时不变令牌进行解码,获得重构后语音;即通过时不变提取器对语音信号的时不变信息进行单独编码,在更少的语音编码令牌数量时能够实现高质量语音重建。
-
公开(公告)号:CN116844565A
公开(公告)日:2023-10-03
申请号:CN202310726317.2
申请日:2023-06-19
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于多候选策略的语音攻防自动化博弈方法、装置及设备,其中方法包括:确定语音攻防博弈模型,语音攻防博弈模型由博弈方集合、各博弈方对应的策略空间集合和各博弈方选择的策略对应的收益函数构成;将语音攻防博弈模型表示为博弈树的形式,并基于博弈树下各博弈方选择的策略对应的收益函数,得到博弈树下的支付矩阵;对支付矩阵进行求解,得到语音攻防自动化博弈对应的纳什均衡解。本发明提供的方法、装置及设备,此过程利用博弈论理论建模语音攻防双方的行为,实现博弈自动化运转,并通过均衡思想在面对黑盒攻防时提供合理的纳什均衡解,从而提升博弈双方整体的鲁棒性和成功率,并且,得到的纳什均衡解适用于真实对抗情况。
-
公开(公告)号:CN115249487B
公开(公告)日:2023-04-14
申请号:CN202210863709.9
申请日:2022-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种回放边界负样例的增量式生成语音检测方法和系统。属于生成语音检测领域,其中,方法包括:在可以保存少量旧样本的情况下,通过挑选具有代表性生成语音数据进行保存,在后续的模型更新中将其加入到新的训练数据中,以减少模型对于旧有知识的遗忘,使得模型同时具备对原有伪造语音和新型伪造语音的检测能力,能够对新型未知的生成语音快速及时响应,持续性更新。
-
公开(公告)号:CN115862656A
公开(公告)日:2023-03-28
申请号:CN202310054459.9
申请日:2023-02-03
Applicant: 中国科学院自动化研究所
IPC: G10L21/0224 , G10L21/0232 , G10L19/26 , H04R1/08
Abstract: 本公开涉及一种骨传麦克风语音增强方法及装置、设备及存储介质,所述方法包括:获取两种频域信号,并根据预设的截止频率,对所述两种频域信号分别进行截取,得到两种截取后频域信号;对所述两种截取后频域信号分别进行半波整流,得到两种半波整流后时域信号;按照预设的中间频带,根据所述两种半波整流后时域信号确定融合因子;根据融合因子对所述两种截取后频域信号进行融合,得到骨传麦克风语音增强语音,根据预设的截止频率作为滤波器组,先对两种频域信号进行截取和融合,并通过半波整流对整体信号进行修正,实现对噪声的有效抑制,能够保留骨传导麦克风清晰的低频信号,同时对其缺失的中、高频信息进行补充,得到感知质量更高的音频信号。
-
公开(公告)号:CN115249487A
公开(公告)日:2022-10-28
申请号:CN202210863709.9
申请日:2022-07-21
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种回放边界负样例的增量式生成语音检测方法和系统。属于生成语音检测领域,其中,方法包括:在可以保存少量旧样本的情况下,通过挑选具有代表性生成语音数据进行保存,在后续的模型更新中将其加入到新的训练数据中,以减少模型对于旧有知识的遗忘,使得模型同时具备对原有伪造语音和新型伪造语音的检测能力,能够对新型未知的生成语音快速及时响应,持续性更新。
-
公开(公告)号:CN113421592B
公开(公告)日:2021-12-14
申请号:CN202110983510.5
申请日:2021-08-25
Applicant: 中国科学院自动化研究所
IPC: G10L25/51
Abstract: 本公开涉及一种篡改音频的检测方法、装置及存储介质,上述方法包括:获取待检测信号,并分别通过低通滤波器和高通滤波器提取所述待检测信号的低频成分和高频成分;分别对所述低频成分和所述高频成分进行离散小波变换,并计算经过所述离散小波变换之后的低频成分对应的低频小波系数和经过所述离散小波变换之后的高频成分对应的高频小波系数;根据所述低频小波系数和所述高频小波系数,计算高低频能量比特征;根据所述高低频能量比特征对所述待检测信号进行篡改音频检测。采用上述技术手段,可以解决现有技术中,现有的检测篡改音频的方法的应用场景受限,在一些场景无法使用的问题。
-
公开(公告)号:CN113488070B
公开(公告)日:2021-11-16
申请号:CN202111048241.X
申请日:2021-09-08
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种篡改音频的检测方法、装置、电子设备及存储介质,上述方法包括:获取待检测信号,并对待检测信号进行第一预设阶数的小波变换,得到数量等于第一预设阶数的待检测信号对应的第一低频系数和第一高频系数;对阶数大于等于第二预设阶数的第一高频系数进行小波逆变换,得到待检测信号对应的第一高频分量信号;以帧为单位计算第一高频分量信号的第一梅尔倒谱特征,并将第一高频分量信号的当前帧信号和当前帧信号之前的预设数量的帧信号的第一梅尔倒谱特征融合,得到第一融合特征;通过深度学习模型对第一融合特征进行篡改音频检测。
-
公开(公告)号:CN113380235B
公开(公告)日:2021-11-16
申请号:CN202110931452.1
申请日:2021-08-13
Applicant: 中国科学院自动化研究所
Abstract: 本发明提供一种基于知识迁移的电话信道虚假语音鉴别方法,包括:将利用麦克风信道语音数据训练而得的鉴别模型作为麦克风信道模型,将利用电话信道语音训练数据训练得到的声学模型视为电话信道模型;在所述电话信道模型训练过程中,应用所述麦克风信道模型指导所述电话信道模型进行训练,使得所述电话信道模型模仿所述麦克风信道模型的行为,即迫使所述电话信道模型的后验概率分布逼近所述麦克风信道模型的后验概率分布;应用训练后的电话信道模型对电话信道语音进行预测,得到电话信道语音的真假判别结果。
-
公开(公告)号:CN113555007A
公开(公告)日:2021-10-26
申请号:CN202111116267.3
申请日:2021-09-23
Applicant: 中国科学院自动化研究所
Abstract: 本公开涉及一种语音拼接点检测方法及存储介质,上述方法包括:获取待检测语音,并确定所述待检测语音的高频成分和低频成分;根据所述高频成分和所述低频成分提取所述待检测语音所对应的第一倒谱特征和第二倒谱特征;以帧为单位,拼接所述待检测语音中的每一帧语音中的第一倒谱特征和第二倒谱特征,得到参数序列;将所述参数序列输入神经网络模型,输出所述待检测语音所对应的特征序列,其中,所述神经网络模型已通过训练,学习并保存有参数序列与所述特征序列之间的对应关系;根据所述特征序列对所述待检测语音进行语音拼接点检测。采用上述技术手段,解决现有技术中,通过单一的声学特征对语音拼接点进行检测,语音拼接点检测的准确率低的问题。
-
-
-
-
-
-
-
-
-