Patent search ap:("中国科学院自动化研究所") AND inv:"张震" Page 2

11.

发明授权
自动寻参的语音鉴别模型的构建方法及装置有权

公开(公告)号：CN115083421B

公开(公告)日：2022-11-15

申请号：CN202210859650.6

申请日：2022-07-21

Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心

Inventor： 陶建华 , 王成龙 , 易江燕 , 张震 , 李鹏 , 石瑾 , 杜金浩

IPC: G10L17/04 , G10L17/02 , G10L17/18 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本公开涉及一种自动寻参的语音鉴别模型的构建方法及装置，能自动调整超参数至最优，该方法包括：获取训练集中的语音数据；基于预训练语音特征提取模型，对语音数据进行特征提取，得到语音特征；将语音特征输入至轻量化可微结构并作为初始节点，根据搜索空间预定义的候选操作进行网络结构搜索，得到包含所有候选分支路径和候选节点的候选网络结构；其中候选操作表征从前一节点到后一节点的网络连接关系；将语音数据为真伪语音的真实结果作为训练标签，在训练过程中对候选网络结构的节点之间候选操作对应的结构权重进行调整；根据训练完成的结构权重，对候选网络结构进行精简，得到目标网络结构；根据目标网络结构，生成语音鉴别模型。

12.

发明授权
语音检测方法及装置、电子设备及存储介质有权

公开(公告)号：CN114420100B

公开(公告)日：2022-06-21

申请号：CN202210321299.5

申请日：2022-03-30

Applicant: 中国科学院自动化研究所

Inventor： 傅睿博 , 陶建华 , 易江燕 , 张震 , 孙旭东 , 刘睿霖 , 王立强

IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L25/60

Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质，所述方法包括：对待检测语音进行声学特征提取，得到第一声学特征和第二声学特征；将第一声学特征序列输入预先训练好的采样率预测模型，得到采样率信息特征；将第二声学特征和采样率信息特征输入预先训练好的语音检测模型，得到待检测语音为真实语音或合成语音的分类结果，结合采样率信息特征对待检测语音进行检测，能够对实际场景中音频进行音频质量的快速判别，帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别，避免假高频语音对模型判别进行干扰，提高检测模型的分类精确度。

13.

发明公开
一种统一的语音合成与语音转换的训练方法和系统有权

公开(公告)号：CN114495898A

公开(公告)日：2022-05-13

申请号：CN202210395964.5

申请日：2022-04-15

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 汪涛 , 易江燕 , 傅睿博 , 张震

IPC: G10L13/02 , G10L13/027 , G10L13/08

Abstract: 本发明提出一种统一的语音合成与语音转换的训练方法和系统。其中，方法包括：将语音合成和语音转换的编码任务解耦成三个子任务，分别为内容信息的提取、说话人信息的提取和韵律信息的提取；所述内容信息是与说话人无关的语言信息；所述说话人信息包括：说话人的特征；所述韵律信息表示说话人如何说出内容信息，反映语音的节奏；将提取得到的所述内容信息、说话人信息和韵律信息输入解码任务，得到还原的语音信息。本发明提出的方案，将语音合成与语音转换模型进行了统一，避免了独立搭建的困难；使用无标注的语音提高语音合成与语音转换的性能。

14.

发明公开
语音检测方法及装置、电子设备及存储介质有权

公开(公告)号：CN114420100A

公开(公告)日：2022-04-29

申请号：CN202210321299.5

申请日：2022-03-30

Applicant: 中国科学院自动化研究所

Inventor： 傅睿博 , 陶建华 , 易江燕 , 张震 , 孙旭东 , 刘睿霖 , 王立强

IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L25/60

Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质，所述方法包括：对待检测语音进行声学特征提取，得到第一声学特征和第二声学特征；将第一声学特征序列输入预先训练好的采样率预测模型，得到采样率信息特征；将第二声学特征和采样率信息特征输入预先训练好的语音检测模型，得到待检测语音为真实语音或合成语音的分类结果，结合采样率信息特征对待检测语音进行检测，能够对实际场景中音频进行音频质量的快速判别，帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别，避免假高频语音对模型判别进行干扰，提高检测模型的分类精确度。

Patent Agency Ranking