Patent search ap:("中国科学院自动化研究所" OR "国家计算机网络与信息安全管理中心") AND inv:"陶建华" Page 11

101.

发明公开
一种嵌入式语音合成方法及系统有权转让

公开(公告)号：CN1924994A

公开(公告)日：2007-03-07

申请号：CN200510086311.5

申请日：2005-08-31

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张皖志

IPC: G10L13/00 , G10L13/02

Abstract: 本发明公开了一种嵌入式语音合成方法及系统，用于手持数字移动设备操作系统，将系统接收到的或输入的任意文字串转换成语音输出。以汉语中的声韵母作为合成系统及语音库的基本单元；首先创建基于声韵母的原始语音库，然后基于声韵母样本的上下文环境属性以及声学特征，对所述原始语音库进行量化压缩，最后通过语音压缩算法对所述量化压缩后的语料库进行编码压缩，得到最终的压缩语音库。依据本发明提供的方法可提升合成系统的可压缩性，从而降低其在嵌入式平台下所占用的系统资源，同时可使得合成结果保持较好的自然度和可懂度。

102.

发明授权
一种基于高频特征的区域生成音频检测与定位方法及装置有权

公开(公告)号：CN118298852B

公开(公告)日：2024-09-10

申请号：CN202410726562.8

申请日：2024-06-06

Applicant: 中国科学院自动化研究所

Inventor： 何佳毅 , 易江燕 , 陶建华

IPC: G10L25/51 , G10L25/27

Abstract: 本发明提供了一种基于高频特征的区域生成音频检测与定位方法及装置，应用于音频处理领域。该方法包括：提取待检测音频中目标频率的信号，得到待检测信号；对待检测信号进行分帧处理，得到至少两个待检测帧；针对至少两个待检测帧中的每个待检测帧，将待检测帧分别与至少两个待检测帧中的其他待检测帧进行组合，生成至少一个待检测帧对；将至少一个待检测帧对输入训练好的音频检测与定位模型中，输出至少一个待检测帧对各自对应的相似度；根据至少一个待检测帧对各自对应的相似度，和至少两个待检测帧各自对应的帧时间，从待检测音频中检测和定位生成区段。本发明的方法能够从待检测音频中检测和定位生成区段，解决了难以定位生成区段的问题。

103.

发明公开
一种基于持续强化学习的语音攻防博弈自反馈方法及装置有权

公开(公告)号：CN118366479A

公开(公告)日：2024-07-19

申请号：CN202410788551.2

申请日：2024-06-19

Applicant: 中国科学院自动化研究所

Inventor： 何佳毅 , 易江燕 , 陶建华 , 陈玉杰

IPC: G10L25/51 , G10L25/27

Abstract: 本发明提供了一种基于持续强化学习的语音攻防博弈自反馈方法及装置，可以应用于人工智能技术领域。该方法包括：将从数据集中获取的样本数据输入到对抗样本生成子模型中，利用对抗样本生成策略对样本数据进行处理，生成语音样本；在语音样本通过质量评估的情况下，将语音样本输入到语音鉴别子模型中，输出对语音样本的鉴别结果；对比鉴别结果与语音样本的真实标签，得到对比结果，对比结果用于反馈调节对抗样本生成策略；在对比结果表征鉴别结果与语音样本的真实标签不同的情况下，将语音样本存储到增量样本集中，并利用持续学习子模型基于增量样本集对语音鉴别子模型进行增量训练。

104.

发明授权
语音控制方法、装置、电子设备及存储介质有权

公开(公告)号：CN113436629B

公开(公告)日：2024-06-04

申请号：CN202110997178.8

申请日：2021-08-27

Applicant: 中国科学院自动化研究所

Inventor： 聂帅 , 陶建华 , 梁山 , 易江燕 , 傅睿博

IPC: G10L15/22 , G10L15/14 , G10L15/06

Abstract: 本申请涉及一种语音控制方法、装置、电子设备及存储介质，所述语音控制方法，包括以下步骤：获取已知唤醒词的音节；确定与所述唤醒词对应的非唤醒词的音节；根据所述唤醒词的音节、所述非唤醒词的音节和预设的垃圾词信息构建唤醒词解码网络，以根据所述唤醒词解码网络对输入的语音进行解码，并根据解码结果确定是否执行唤醒操作，本申请在解码网络中引入非唤醒词的音节从而统一描述非唤醒词，能够降低非唤醒词引起的误唤醒率。

105.

发明授权
基于孪生网络的远程监督关系抽取降噪系统有权

公开(公告)号：CN112668342B

公开(公告)日：2024-05-07

申请号：CN202110024800.7

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 霍文帅 , 张大伟 , 杨国花 , 刘通

IPC: G06F40/30 , G06F40/289 , G06F16/36 , G06F16/35 , G06F18/23213 , G06N3/0464 , G06N3/08

Abstract: 本申请实施例涉及一种基于孪生网络的远程监督关系抽取降噪系统，旨在旨在降低远程监督回标训练数据的噪声影响，同时减少训练数据损失的情况。该系统包括：文本分析模块，关系选择器训练模块，关系选择模块，噪声数据聚类模块，关系分类模块；所述文本分析模块用于接收远程监督回标文本数据，输出初始候选数据和初始高可信度数据；所述关系选择器训练模块用于利用标注好的文本数据训练出基于孪生网络的关系选择器；所述关系选择模块用于对初始候选数据和初始高可信度数据进行关系选择，输出噪声数据和新增高可信度数据；所述噪声聚类模块用于对噪声数据进行聚类分析，输出新增候选数据，所述关系分类模块用于输出最后的分类结果。

106.

发明授权
一种基于张量分解的知识推理方法、装置、设备有权

公开(公告)号：CN113051404B

公开(公告)日：2024-02-06

申请号：CN202110024807.9

申请日：2021-01-08

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 邵朋朋 , 刘通 , 杨国花 , 张大伟

IPC: G06F16/36 , G06F16/2455

Abstract: 本申请实施例涉及数据处理技术领域，具体涉及一种基于张量分解的知识推理方法、装置、设备，旨在提高时序知识推理任务的准确率。所述方法包括：对时序知识图谱数据集中的数据进行提取，得到多组四元组数据，多组四元组数据中的每组四元组数据中包含了头实体、关系、尾实体以及时间；对多组四元组数据进行标注及处理，将处理好的四元组数据作为训练材料；将训练材料输入基于张量分解的时序知识推理模型及其变体模型中，利用梯度下降算法对时序知识推理模型及其变体模型分别进行训练，得到训练好的时序知识推理模型及其变体模型；使用训练好的时序知识推理模型及其变体模型分别执行预测任务，推理问题的答案，得到最终的推理结果。

107.

发明公开
基于时不变编码的少令牌神经语音编解码方法和系统有权

公开(公告)号：CN117292694A

公开(公告)日：2023-12-26

申请号：CN202311564716.X

申请日：2023-11-22

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 任勇 , 易江燕

IPC: G10L19/00 , G10L25/30

Abstract: 本发明实施例涉及一种基于时不变编码的少令牌神经语音编解码方法和系统，应用于训练好的神经语音编解码模型，该神经语音编解码模型包括编码器、时不变提取器、量化器和解码器；基于所述编码器对待处理语音进行编码，获得编码器输出层的隐层表示及编码器中间层的中间层表示；基于所述时不变提取器对所述中间层表示进行时不变特征提取，获得时不变表示；基于所述量化器分别对所述隐层表示和时不变表示进行量化，获得帧级别语音令牌和时不变令牌；基于所述解码器对所述帧级别语音令牌和时不变令牌进行解码，获得重构后语音；即通过时不变提取器对语音信号的时不变信息进行单独编码，在更少的语音编码令牌数量时能够实现高质量语音重建。

108.

发明公开
生成语音鉴别模型的连续学习方法、装置和电子设备有权

公开(公告)号：CN115938390A

公开(公告)日：2023-04-07

申请号：CN202310017442.6

申请日：2023-01-06

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 张晓辉 , 易江燕

IPC: G10L25/30 , G10L25/51 , G10L15/06

Abstract: 本发明涉及一种生成语音鉴别模型的连续学习方法、装置和电子设备，生成语音鉴别模型的连续学习方法包括：获取源数据集，根据源数据集，确定第一数据模型；获取目标数据集，根据目标数据集，对第一数据模型进行梯度修正，以得到第二数据模型；对第二数据模型进行正则化修正，以得到目标数据模型。

109.

发明授权
语音检测方法及装置、电子设备及存储介质有权

公开(公告)号：CN114420100B

公开(公告)日：2022-06-21

申请号：CN202210321299.5

申请日：2022-03-30

Applicant: 中国科学院自动化研究所

Inventor： 傅睿博 , 陶建华 , 易江燕 , 张震 , 孙旭东 , 刘睿霖 , 王立强

IPC: G10L15/02 , G10L15/06 , G10L15/08 , G10L25/60

Abstract: 本公开涉及一种语音检测方法及装置、电子设备及存储介质，所述方法包括：对待检测语音进行声学特征提取，得到第一声学特征和第二声学特征；将第一声学特征序列输入预先训练好的采样率预测模型，得到采样率信息特征；将第二声学特征和采样率信息特征输入预先训练好的语音检测模型，得到待检测语音为真实语音或合成语音的分类结果，结合采样率信息特征对待检测语音进行检测，能够对实际场景中音频进行音频质量的快速判别，帮助语音检测模型对实际音频的不同频带进行更加有侧重的识别，避免假高频语音对模型判别进行干扰，提高检测模型的分类精确度。

110.

发明公开
一种统一的语音合成与语音转换的训练方法和系统有权

公开(公告)号：CN114495898A

公开(公告)日：2022-05-13

申请号：CN202210395964.5

申请日：2022-04-15

Applicant: 中国科学院自动化研究所

Inventor： 陶建华 , 汪涛 , 易江燕 , 傅睿博 , 张震

IPC: G10L13/02 , G10L13/027 , G10L13/08

Abstract: 本发明提出一种统一的语音合成与语音转换的训练方法和系统。其中，方法包括：将语音合成和语音转换的编码任务解耦成三个子任务，分别为内容信息的提取、说话人信息的提取和韵律信息的提取；所述内容信息是与说话人无关的语言信息；所述说话人信息包括：说话人的特征；所述韵律信息表示说话人如何说出内容信息，反映语音的节奏；将提取得到的所述内容信息、说话人信息和韵律信息输入解码任务，得到还原的语音信息。本发明提出的方案，将语音合成与语音转换模型进行了统一，避免了独立搭建的困难；使用无标注的语音提高语音合成与语音转换的性能。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification