Patent search ap:("中国科学院自动化研究所") AND inv:"傅睿博" Page 4

31.

发明公开
语音控制方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN113436629A

公开(公告)日：2021-09-24

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

32.

发明公开
基于知识迁移的电话信道虚假语音鉴别方法及存储介质有权

公开(公告)号：CN113380235A

公开(公告)日：2021-09-10

申请号：CN202110931452.1

申请日：2021-08-13

Applicant: 中国科学院自动化研究所

Inventor： 易江燕 , 陶建华 , 田正坤 , 傅睿博

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L25/30 , G10L25/51

Abstract: 本发明提供一种基于知识迁移的电话信道虚假语音鉴别方法，包括：将利用麦克风信道语音数据训练而得的鉴别模型作为麦克风信道模型，将利用电话信道语音训练数据训练得到的声学模型视为电话信道模型；在所述电话信道模型训练过程中，应用所述麦克风信道模型指导所述电话信道模型进行训练，使得所述电话信道模型模仿所述麦克风信道模型的行为，即迫使所述电话信道模型的后验概率分布逼近所述麦克风信道模型的后验概率分布；应用训练后的电话信道模型对电话信道语音进行预测，得到电话信道语音的真假判别结果。

33.

发明公开
一种环境对抗的鲁棒语音鉴别方法有权

公开(公告)号：CN113284486A

公开(公告)日：2021-08-20

申请号：CN202110841144.X

申请日：2021-07-26

Applicant: 中国科学院自动化研究所

Inventor： 易江燕 , 陶建华 , 傅睿博 , 田正坤

IPC: G10L15/06 , G10L15/20

Abstract: 本发明提供一种环境对抗的鲁棒语音鉴别方法，包括：采集语音鉴别模型训练数据；提取所述训练数据中每个语音句子的训练声学特征；将所述训练声学特征输入语音鉴别模型，所述语音鉴别模型包括：语音真假判别器和环境对抗判别器，联合优化语音鉴别模型的语音真假判别器和环境对抗判别器的损失函数；得到训练后的语音鉴别模型；采集语音鉴别模型预测数据；提取所述预测数据中每个语音句子的预测声学特征；将所述预测声学特征输入训练后的去除环境对抗判别器的所述语音鉴别模型，输出语音的判别结果。

34.

发明公开
基于深度度量网络的语音合成方法及装置有权

公开(公告)号：CN109346056A

公开(公告)日：2019-02-15

申请号：CN201811102108.6

申请日：2018-09-20

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 傅睿博 , 温正棋 , 李雅

IPC: G10L13/02 , G10L13/08 , G06N3/04 , G06N3/08

Abstract: 本发明涉及语音合成技术领域，具体涉及一种基于深度度量网络的语音合成方法及装置，旨在解决如何得到更为精确的目标代价以及品质更高的合成语音的技术问题。该方法包括将待测文本信息拆分为多个文本基元，提取文本基元的文本特征；从语料库中获取对应的多个候选基元，并提取每个候选基元对应的文本特征和声学特征；对文本基元的文本特征进行编码得到第一特征向量，对候选基元的文本特征和声学特征进行编码得到第二特征向量；计算文本基元对应的第一特征向量与其对应候选基元的第二特征向量之间的余弦距离，获取目标代价；利用语音合成系统根据目标代价对候选基元进行拼接合成语音。上述方法可以提升合成语音的品质。

Patent Agency Ranking