-
公开(公告)号:CN117219054A
公开(公告)日:2023-12-12
申请号:CN202311411597.4
申请日:2023-10-27
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本申请实施例提供一种音素序列生成方法、语音合成方法及相关产品,涉及语音合成领域,音素序列生成方法包括:将待进行语音合成的目标文本输入到韵律预测模型中,得到所述目标文本的第一韵律标签;根据韵律固定词表,确定所述目标文本中的韵律固定搭配词语;根据所述目标文本中的韵律固定搭配词语,对所述目标文本的第一韵律标签进行矫正,得到所述目标文本的第二韵律标签;其中,所述第二韵律标签标识的韵律边界在对所述目标文本划分韵律单元时,使所述韵律固定搭配词语被划分为一个韵律单元;根据所述目标文本的第二韵律标签以及所述目标文本中各汉字的注音,生成所述目标文本的音素序列,该方法能够提高音素序列的生成准确度和错误修复效率。
-
公开(公告)号:CN118428456A
公开(公告)日:2024-08-02
申请号:CN202410524677.9
申请日:2024-04-28
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06N3/10 , G06N3/082 , G06N3/0495 , G06N3/045
Abstract: 本说明书公开了一种模型部署方法、装置、存储介质及电子设备。该模型部署的方法包括:获取训练各原始模型的各原始训练样本集,并将各原始训练样本集进行合并,得到合并训练样本集;针对合并训练样本集中包含的每个训练样本,将该训练样本输入到待训练的合并模型以及各原始模型中,以获得待训练的合并模型输出得针对该训练样本的待验证结果和各原始模型分别输出的针对该训练样本的原始输出结果,最后,以最小化该训练样本对应的标签结果与该训练样本对应的待验证结果之间的偏差,以及最小化该训练样本对应的各原始输出结果与该训练样本对应的待验证结果之间的偏差为优化目标,对合并模型进行训练,并将训练后的合并模型替换各原始模型进行部署。
-