-
公开(公告)号:CN101334994A
公开(公告)日:2008-12-31
申请号:CN200810124891.6
申请日:2008-06-25
Applicant: 富士通株式会社
CPC classification number: G10L13/08
Abstract: 本发明涉及文本到语音设备。根据本发明实施例的一个方面提供一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述多个停顿被插入到将被转换为声音信号的所述文本数据的一系列音素之间;音素长度调整器,用于分别根据所述声音信号的速度确定所述音素的长度,以及选择性调整所述音素中紧接在一个所述停顿之后的至少一个音素的长度,使得所述至少一个音素与其它音素相比在时间上被相对延长,以此调整所述音素数据和所述停顿数据;以及输出单元,用于基于通过所述音素长度调整器所调整的音素数据和停顿数据,输出所述声音信号。
-
公开(公告)号:CN1956057B
公开(公告)日:2011-01-26
申请号:CN200510117003.4
申请日:2005-10-28
Applicant: 富士通株式会社
Abstract: 本发明为一种基于决策树的语音时长预测装置及方法。包括:输入部,用于输入语言、语音学标注序列;决策树生成部,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下文、语音单位的韵律边界等级、语音单位的重音等级中的至少一个为基准设定改变语音单位固定时长的变更量;以所述的固定时长和所述固定时长的变更量为基准对输入的语言、语音学标注序列的各个相应的语音单位进行改变;输出部,用于输出语音单位时长预测结果序列。从而能够在语音合成时对语音单位时长进行预测。
-
公开(公告)号:CN100568225C
公开(公告)日:2009-12-09
申请号:CN200610165633.3
申请日:2006-12-08
Applicant: 富士通株式会社
Abstract: 本发明为一种自然语言文本中数字和符号串的文字符号化处理方法及系统,所述的方法包括以下步骤:输入自然语言文本;逐段抽取所述自然语言文本中的数字和符号串;将当前数字和符号串与预存储的模板进行匹配,获得当前数字和符号串所属的模板类型;记录历史数字和符号串的模板类型及相关信息;根据当前数字和符号串所属的模板类型以及当前数字和符号串相邻的历史数字和符号串的模板类型及相关信息对当前数字和符号串进行文字符号化处理。提高了对文本中数字和特殊符号的识别精度和效率。
-
公开(公告)号:CN101196881A
公开(公告)日:2008-06-11
申请号:CN200610165633.3
申请日:2006-12-08
Applicant: 富士通株式会社
Abstract: 本发明为一种自然语言文本中数字和符号串的文字符号化处理方法及系统,所述的方法包括以下步骤:输入自然语言文本;逐段抽取所述自然语言文本中的数字和符号串;将当前数字和符号串与预存储的模板进行匹配,获得当前数字和符号串所属的模板类型;记录历史数字和符号串的模板类型及相关信息;根据当前数字和符号串所属的模板类型以及当前数字和符号串相邻的历史数字和符号串的模板类型及相关信息对当前数字和符号串进行文字符号化处理。提高了对文本中数字和特殊符号的识别精度和效率。
-
公开(公告)号:CN101271688B
公开(公告)日:2011-07-20
申请号:CN200810086741.0
申请日:2008-03-20
Applicant: 富士通株式会社
IPC: G10L13/08
CPC classification number: G10L13/0335 , G10L13/033 , G10L21/003
Abstract: 本发明涉及韵律修改装置和方法。该韵律修改装置包括:真实话音韵律输入部,用于接收从人类发声中提取的真实话音韵律信息;规则韵律生成部,用于针对真实话音韵律信息中的至少包括要修改的音素或音素串的部分,利用表示人类发声中的规则的或统计出的音素长度的数据来生成规则韵律信息(其具有确定音素之间的边界的规则音素边界和音素的规则音素长度);以及真实话音韵律修改部,其利用生成的规则韵律信息,重置真实话音音素边界,以使真实话音韵律信息中的要修改的音素或音素串的真实话音音素边界和真实话音音素长度接近于人类发声的实际音素边界和实际音素长度,由此修改真实话音韵律信息。
-
公开(公告)号:CN101572083A
公开(公告)日:2009-11-04
申请号:CN200810096066.X
申请日:2008-04-30
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 本发明涉及韵律词组词方法和装置,该方法包括以下步骤:词性获得步骤,获得输入的句子中的各语言学词的词性;词位获得步骤,获得所述输入的句子中的各所述语言学词的在所属韵律词中的各可能候选词位以及处于各可能候选词位的概率;路径获得步骤,获得所有可能顺序组合,各所述可能组合顺序包括所述输入的句子中的每一个所述语言学词的一个可能候选词位;概率计算步骤,根据各所述语言学词处于其可能候选词位的概率,计算所述所有可能顺序组合中的各可能顺序组合的概率;以及最终路径确定步骤,根据所确定出的各可能顺序组合的概率,确定所述输入的句子中的各所述语言学词的词位。
-
公开(公告)号:CN101202041A
公开(公告)日:2008-06-18
申请号:CN200610167040.0
申请日:2006-12-13
Applicant: 富士通株式会社
CPC classification number: G10L13/10
Abstract: 本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。
-
公开(公告)号:CN101572083B
公开(公告)日:2011-09-07
申请号:CN200810096066.X
申请日:2008-04-30
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 本发明涉及韵律词组词方法和装置,该方法包括以下步骤:词性获得步骤,获得输入的句子中的各语言学词的词性;词位获得步骤,获得所述输入的句子中的各所述语言学词的在所属韵律词中的各可能候选词位以及处于各可能候选词位的概率;路径获得步骤,获得所有可能顺序组合,各所述可能组合顺序包括所述输入的句子中的每一个所述语言学词的一个可能候选词位;概率计算步骤,根据各所述语言学词处于其可能候选词位的概率,计算所述所有可能顺序组合中的各可能顺序组合的概率;以及最终路径确定步骤,根据所确定出的各可能顺序组合的概率,确定所述输入的句子中的各所述语言学词的词位。
-
公开(公告)号:CN101334994B
公开(公告)日:2011-08-03
申请号:CN200810124891.6
申请日:2008-06-25
Applicant: 富士通株式会社
CPC classification number: G10L13/08
Abstract: 本发明涉及文本到语音设备。根据本发明实施例的一个方面提供一种用于将文本数据转换为声音信号的设备,包括:音素确定器,用于确定与多个音素相对应的音素数据以及与多个停顿相对应的停顿数据,其中所述多个停顿被插入到将被转换为声音信号的所述文本数据的一系列音素之间;音素长度调整器,用于分别根据所述声音信号的速度确定所述音素的长度,以及选择性调整所述音素中紧接在一个所述停顿之后的至少一个音素的长度,使得所述至少一个音素与其它音素相比在时间上被相对延长,以此调整所述音素数据和所述停顿数据;以及输出单元,用于基于通过所述音素长度调整器所调整的音素数据和停顿数据,输出所述声音信号。
-
公开(公告)号:CN101202041B
公开(公告)日:2011-01-05
申请号:CN200610167040.0
申请日:2006-12-13
Applicant: 富士通株式会社
CPC classification number: G10L13/10
Abstract: 本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。
-
-
-
-
-
-
-
-
-