-
公开(公告)号:CN102194454A
公开(公告)日:2011-09-21
申请号:CN201010119995.5
申请日:2010-03-05
Applicant: 富士通株式会社
IPC: G10L15/00
Abstract: 本发明公开了一种语音关键词检测设备和方法,其中所述设备包括:输入装置,用于输入连续语音;识别装置,用于从连续语音中识别候选关键词,并给出相应的置信度,并且识别连续语音中包括的填充音;韵律特征提取装置,用于提取与特定相邻填充音相关的韵律特征;韵律词边界确定装置,用于根据韵律特征来确定特定相邻填充音之间的边界为韵律词边界的概率;置信度调整装置,用于根据与候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率,调整候选关键词的置信度;判决设置,用于判决调整后的候选关键词的置信度是否高于预先设定的阈值;以及输出装置,将调整后的置信度高于预先设定的阈值的候选关键词作为关键词输出。
-
公开(公告)号:CN101930735A
公开(公告)日:2010-12-29
申请号:CN200910150458.4
申请日:2009-06-23
Applicant: 富士通株式会社
Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据说话人说话过程中情感状态之间的转换的条件概率知识,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态。
-
公开(公告)号:CN101930735B
公开(公告)日:2012-11-21
申请号:CN200910150458.4
申请日:2009-06-23
Applicant: 富士通株式会社
Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据从关于说话人说话过程中情感状态之间的转换的条件概率知识中寻找到的、已确定的情感状态和可能情感状态间的条件概率,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态,其中分析装置进一步被配置为输出可能情感状态的出现概率,并且概率计算装置被进一步配置为结合出现概率来计算最终概率;以及其中最终概率基于出现概率和条件概率的加权和。
-
公开(公告)号:CN101572083B
公开(公告)日:2011-09-07
申请号:CN200810096066.X
申请日:2008-04-30
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 本发明涉及韵律词组词方法和装置,该方法包括以下步骤:词性获得步骤,获得输入的句子中的各语言学词的词性;词位获得步骤,获得所述输入的句子中的各所述语言学词的在所属韵律词中的各可能候选词位以及处于各可能候选词位的概率;路径获得步骤,获得所有可能顺序组合,各所述可能组合顺序包括所述输入的句子中的每一个所述语言学词的一个可能候选词位;概率计算步骤,根据各所述语言学词处于其可能候选词位的概率,计算所述所有可能顺序组合中的各可能顺序组合的概率;以及最终路径确定步骤,根据所确定出的各可能顺序组合的概率,确定所述输入的句子中的各所述语言学词的词位。
-
公开(公告)号:CN101202041B
公开(公告)日:2011-01-05
申请号:CN200610167040.0
申请日:2006-12-13
Applicant: 富士通株式会社
CPC classification number: G10L13/10
Abstract: 本发明为一种汉语韵律词组词方法及装置,所述方法包括:输入汉语文本;对输入的汉语文本进行分词和词性标注处理,生成一初始的韵律词序列;在初始的韵律词序列中所有的词边界上插入代表韵律词边界的隔栅,生成一隔栅韵律词序列;根据韵律词组词手段标注隔栅韵律词序列中预备删除的隔栅;根据韵律词组词手段判断预备删除的隔栅中实际需要删除的隔栅;删除隔栅韵律词序列中实际需要删除的隔栅,并使剩余隔栅中的每两个隔栅之间的词进行组词,生成韵律词。通过减少韵律词边界插入型错误的数目,尽量避免韵律词组词中插入型错误而导致的语音难以理解或者不自然的缺陷,减少韵律词边界插入类型错误的数目。
-
公开(公告)号:CN101814288A
公开(公告)日:2010-08-25
申请号:CN200910007682.8
申请日:2009-02-20
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 使语音合成时长模型自适应的方法和设备。设备包括:参考模型生成装置,其根据所述语音合成时长模型的分类结构对参考样本数据中每个语音合成单元的样本进行分类,通过计算对应于每个分类的样本集的参考样本数目和参考时长,生成参考语音合成时长模型;和模型自适应装置,其使所述语音合成时长模型中每个语音合成单元的每个时长,适应所述参考语音合成时长模型中相同语音合成单元的、对应于所述时长的分类的参考时长。
-
公开(公告)号:CN101685633A
公开(公告)日:2010-03-31
申请号:CN200810166002.2
申请日:2008-09-28
Applicant: 富士通株式会社
Abstract: 本发明提供基于韵律参照的语音合成装置和方法。该语音合成装置包括:韵律参数获取部,其通过对按包括自然人朗读待合成文本在内的方式而获得的录音文件进行分析,或者对以预定标注标准对待合成文本进行韵律参数标注而获得的韵律参数标注文件进行分析,来获取自然韵律参数或近似自然韵律参数;和音声作成部,其以该自然韵律参数或近似自然韵律参数作为参照,针对该待合成文本从预录语音库中选择相应的语音合成单元,并对所述语音合成单元进行拼接合成,以产生对应于该待合成文本的合成语音文件。根据本发明的语音合成装置和方法,可以根据用户的要求生成富有感情色彩且抑扬顿挫程度与自然语音非常接近的高自然度的合成语音。
-
公开(公告)号:CN1956057A
公开(公告)日:2007-05-02
申请号:CN200510117003.4
申请日:2005-10-28
Applicant: 富士通株式会社
Abstract: 本发明为一种基于决策树的语音时长预测装置及方法。包括:输入部,用于输入语言、语音学标注序列;决策树生成部,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下文、语音单位的韵律边界等级、语音单位的重音等级中的至少一个为基准设定改变语音单位固定时长的变更量;以所述的固定时长和所述固定时长的变更量为基准对输入的语言、语音学标注序列的各个相应的语音单位进行改变;输出部,用于输出语音单位时长预测结果序列。从而能够在语音合成时对语音单位时长进行预测。
-
公开(公告)号:CN102637433B
公开(公告)日:2015-11-25
申请号:CN201110037314.5
申请日:2011-02-09
Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。
-
公开(公告)号:CN102194454B
公开(公告)日:2012-11-28
申请号:CN201010119995.5
申请日:2010-03-05
Applicant: 富士通株式会社
IPC: G10L15/00
Abstract: 本发明涉及语音关键词检测设备和方法,该设备包括:输入装置,其输入连续语音;识别装置,其从连续语音中识别候选关键词,并给出相应的置信度,并且识别连续语音中包括的作为音子或音节的填充音;韵律特征提取装置,其提取与特定相邻填充音相关的韵律特征;韵律词边界确定装置,其根据韵律特征来确定特定相邻填充音之间的边界为韵律词边界的概率;置信度调整装置,其当与候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率越高时,将候选关键词的置信度调整得越小;判决装置,其判决调整后的候选关键词的置信度是否高于预先设定的阈值;以及输出装置,将调整后的置信度高于预先设定的阈值的候选关键词作为关键词输出。
-
-
-
-
-
-
-
-
-