音频处理模型的训练方法及装置、音频处理方法及装置

    公开(公告)号:CN115512684A

    公开(公告)日:2022-12-23

    申请号:CN202110696106.X

    申请日:2021-06-23

    Abstract: 提供一种音频处理模型的训练方法及装置、音频处理方法及装置。该音频处理模型的训练方法包括:对训练数据进行特征提取,得到训练数据的特征;基于训练数据的特征预测训练数据的颤音程度,得到训练数据的预测颤音程度;基于训练数据的预测颤音程度预测训练数据的基频,得到训练数据的预测基频;基于训练数据的预测颤音程度和预测基频以及训练数据的真实颤音程度和真实基频对音频处理模型进行训练。该音频处理方法包括:提取音频数据的特征;基于音频数据的特征预测音频数据的颤音程度;基于音频数据的颤音程度预测音频数据的基频;基于音频数据的基频对音频数据进行处理。通过使用该音频处理方法及装置,可提高音频处理的效果。

    语音合成模型的训练方法和语音合成方法

    公开(公告)号:CN114387946A

    公开(公告)日:2022-04-22

    申请号:CN202011128918.6

    申请日:2020-10-20

    Abstract: 本申请提供语音合成模型的训练方法和语音合成方法,模型包括文本编码模块、文本解码模块和第一预测编码模块;训练方法包括:获取训练数据集;训练数据集包括发音对象的语音数据,以及与语音数据对应的文本数据;通过文本编码模块,基于文本数据,得到音素编码序列;通过第一预测编码模块,基于语音数据,得到第一音素隐含表示;通过文本解码模块,基于音素编码序列、第一音素隐含表示和发音对象嵌入、情感嵌入,得到语音合成数据;基于语音数据与语音合成数据更新语音合成模型。本申请的实施可有效提高发音对象所对应情感语音的自然度和情感表现力。

    检测和鉴别冲击声的设备和方法

    公开(公告)号:CN1655229A

    公开(公告)日:2005-08-17

    申请号:CN200510005532.5

    申请日:2005-01-20

    CPC classification number: G01H1/00

    Abstract: 提供一种用于检测冲击声的设备和方法和使用其鉴别冲击声的设备和方法。冲击声检测设备包括:发作检测器,将帧单元的输入信号分离为低频信号和高频信号,测量所分离的信号的功率,并通过检测在所测量的功率中的变化来检测发作;事件缓冲器,缓冲通过发作检测器测量的功率和输入信号的频谱数据;和冲击声检验器,确定是否所检测的发作的每一个是冲击发作,并且如果所检测的发作的每一个是冲击发作,通过检查存储在事件缓冲器中的功率来检测从冲击发作开始的事件,并且如果所检测的发作的每一个满足预定条件,则确定所检测的事件的每一个为冲击事件。

    语音生成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN113628608A

    公开(公告)日:2021-11-09

    申请号:CN202010415450.2

    申请日:2020-05-15

    Abstract: 本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升了语音合成的效果。

Patent Agency Ranking