-
公开(公告)号:CN114694632A
公开(公告)日:2022-07-01
申请号:CN202210403587.5
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L13/047 , G10L13/06 , G10L25/18
Abstract: 能使波形的再现性提高且能高速生成波形。语音处理装置具有:存储部,存储对相移后的脉冲信号进行频带分割得到的相移频带脉冲信号;延迟时间算出部,根据从各时刻的语音帧的相位谱算出的群延迟谱的预定频率范围中的频带群延迟参数算出相移频带脉冲信号的延迟时间;相位算出部,根据频带群延迟参数及从频带群延迟参数生成的对相位信息进行修正的频带群延迟修正参数算出边界频率的相位;选择部,基于所算出的各频带的相位从存储部选择对应的相移频带脉冲信号;叠加部,通过使所选择的相移频带脉冲信号按照延迟时间延迟并叠加,生成相移后的声源信号;及声道滤波部,应用与针对输入语音的各语音帧算出的频谱参数对应的声道滤波器输出语音波形。
-
公开(公告)号:CN114464208A
公开(公告)日:2022-05-10
申请号:CN202210141126.5
申请日:2015-09-16
Applicant: 株式会社东芝
IPC: G10L21/10 , G10L13/033 , G10L19/02
Abstract: 不仅能够使波形的再现性提高而且能够高速地生成波形。实施方式的语音处理装置具有:振幅信息生成部,其基于针对输入语音的各语音帧所算出的频谱参数序列,生成振幅信息;相位信息生成部,其根据从所述各语音帧的相位谱所算出的群延迟谱的预定频率范围中的频带群延迟参数序列、和对从所述频带群延迟参数序列所生成的相位谱与所述各语音帧的相位谱之差进行修正的频带群延迟修正参数序列,生成相位信息;以及语音波形生成部,其在由作为各参数的时刻信息的参数序列时刻信息所确定的各时刻,根据所述振幅信息及所述相位信息生成语音波形。
-
公开(公告)号:CN103594082A
公开(公告)日:2014-02-19
申请号:CN201310357397.5
申请日:2013-08-16
Applicant: 株式会社东芝
IPC: G10L13/10
Abstract: 本发明涉及声音合成装置、方法及存储介质,能生成具有多样的韵律特征的合成音且也能保持对象谈话者特质。具备对输入的文本进行解析并输出语言信息的文本解析部、存储对象谈话者的第1韵律控制词典以及1个或多个基准谈话者的第2韵律控制词典的词典存储部、基于语言信息利用第1韵律控制词典生成第1韵律参数并分别利用第2韵律控制词典生成1个或多个第2韵律参数的韵律参数生成部、基于标准化参数分别对1个或多个第2韵律参数进行标准化处理的标准化部、基于权重信息对第1韵律参数及标准化处理后的1个或多个第2韵律参数进行内插处理生成第3韵律参数的韵律参数内插部和按照第3韵律参数生成合成声音的声音合成部。
-
公开(公告)号:CN103632662A
公开(公告)日:2014-03-12
申请号:CN201310364756.X
申请日:2013-08-20
Applicant: 株式会社东芝
IPC: G10L13/08
Abstract: 提供能容易编辑韵律的韵律编辑装置、方法及程序。本实施方式涉及的韵律编辑装置包括:第1选择部、存纳部、检索部、标准化部、映射部、显示部、第2选择部、恢复部及置换部。存纳部对应存纳表示短语相关的属性的属性信息、和1个以上的韵律图形,上述韵律图形表示该短语的韵律的型式,并且表示该短语的韵律的参数包含该短语的音素数以上的要素数。检索部从存纳部检索选择短语和属性信息相一致的1个以上的韵律图形,得到韵律图形集合。映射部将标准化的韵律图形分别映射在数目比要素数少的坐标中表示的低维度空间,生成映射坐标。恢复部按照选择坐标而恢复韵律图形,得到恢复韵律图形。置换部根据选择短语将生成的合成语音的韵律置换为恢复韵律图形。
-
公开(公告)号:CN103021402A
公开(公告)日:2013-04-03
申请号:CN201210058572.6
申请日:2012-03-07
Applicant: 株式会社东芝
IPC: G10L13/02
Abstract: 本发明的实施方式涉及合成字典制作装置及合成字典制作方法。提高声音合成字典的制作效率。合成字典制作装置具备提示单元、录制单元、要否判断单元、字典制作单元和声音合成单元。提示单元向用户提示从上述句子存储单元存储的上述N个(N是自然数,N≥2)句子依次选择的第1句子。录制单元将朗读上述第1句子的用户的声音录制,将该录制波形与上述第1句子相关联存储。要否判断单元,在上述录制单元中存储M个(M是自然数,1≤M<N)上述第1句子的录制波形的状态下,判断要否制作声音合成字典。字典制作单元,在判断需要声音合成字典的制作的场合,制作声音合成字典。声音合成单元,采用由上述字典制作单元制作的声音合成字典,将第2句子变换为合成波形。
-
公开(公告)号:CN103020019A
公开(公告)日:2013-04-03
申请号:CN201210364039.2
申请日:2012-09-26
Applicant: 株式会社东芝
CPC classification number: G06F17/218 , G10L13/04 , G10L13/10 , G10L25/63
Abstract: 本发明涉及标记辅助设备、方法和程序。根据一个实施例,一种标记辅助设备(200)包括获取单元(205)、第一计算单元(208)、检测单元(207)和展示单元(210)。所述获取单元(205)获取各个标签的特征量,每个标签被用于控制标记文本的文本转语音处理。所述第一计算单元(208)针对各个字符串计算在标记文本中被分配给所述字符串的所述标签的特征量的方差。所述检测单元(207)检测被分配有第一标签的第一字符串作为包括要被修正的标签的第一候选项,所述第一标签具有不小于第一阈值的方差。所述展示单元(210)展示所述第一候选项。
-
公开(公告)号:CN101131818A
公开(公告)日:2008-02-27
申请号:CN200710149423.X
申请日:2007-07-31
Applicant: 株式会社东芝
CPC classification number: G10L13/06
Abstract: 一种语音合成装置和方法,其中所述语音合成装置包括:语音单元语料库,存储一组语音单元;选择单元,将目标语音的音素序列划分为多个片段,并从语音单元语料库中为每一片段选择语音单元的组合;评估单元,评估在目标语音与通过融合每一片段的所述组合的每一个语音单元所生成的合成语音之间的失真;选择单元,基于所述失真为每一片段递归地选择语音单元的组合;融合单元,通过对为每一片段所选出的组合的每一个语音单元进行融合来为每一片段生成新的语音单元;以及连接单元,通过连接每一片段的新的语音单元来生成合成语音。
-
-
-
-
-
-