-
公开(公告)号:CN102142253A
公开(公告)日:2011-08-03
申请号:CN201010104779.3
申请日:2010-01-29
Applicant: 富士通株式会社
Abstract: 本发明提供了语音情感识别设备及方法。一种语音情感识别设备,包括:情感识别单元,用于将说话者的语音的当前情感状态识别为初步的情感状态;以及置信度判断单元,用于计算初步的情感状态的置信度,并利用该置信度判断初步的情感状态是否可信,如果初步的情感状态被判断为可信,则将该初步的情感状态确定为最终的情感状态,并输出该最终的情感状态。本发明通过对语音情感状态的识别结果进行置信度判断并根据判断结果来确定最终的情感状态,能够提高语音情感状态的识别结果的准确度。
-
公开(公告)号:CN102099853A
公开(公告)日:2011-06-15
申请号:CN200980127959.9
申请日:2009-03-16
Applicant: 富士通株式会社
CPC classification number: G10L17/26
Abstract: 提供了一种用于从说话人的语音数据中识别说话人的语音情感变化的设备和方法,其中该方法包括以下步骤:窗口分割步骤(S110),将说话人的语音数据按窗口宽度分割成多个窗口;窗口语音情感特征计算步骤(S120),针对所述多个窗口中的每个窗口,计算语音情感特征;以及语音情感变化识别步骤(S130),通过将由至少两个连续窗口构成的窗口集的语音情感特征与存储在语音情感特征变化数据库中的多个语音情感特征变化模板中的每个模板进行比较,以找出与该窗口集的语音情感特征匹配的语音情感特征变化模板,对该窗口集识别说话人的语音情感变化。
-
公开(公告)号:CN102142253B
公开(公告)日:2013-05-29
申请号:CN201010104779.3
申请日:2010-01-29
Applicant: 富士通株式会社
Abstract: 本发明提供了语音情感识别设备及方法。一种语音情感识别设备,包括:情感识别单元,用于将说话者的语音的当前情感状态识别为初步的情感状态;以及置信度判断单元,用于计算初步的情感状态的置信度,并利用该置信度判断初步的情感状态是否可信,如果初步的情感状态被判断为可信,则将该初步的情感状态确定为最终的情感状态,并输出该最终的情感状态。本发明通过对语音情感状态的识别结果进行置信度判断并根据判断结果来确定最终的情感状态,能够提高语音情感状态的识别结果的准确度。
-
公开(公告)号:CN102099853B
公开(公告)日:2012-10-10
申请号:CN200980127959.9
申请日:2009-03-16
Applicant: 富士通株式会社
CPC classification number: G10L17/26
Abstract: 提供了一种用于从说话人的语音数据中识别说话人的语音情感变化的设备和方法,其中该方法包括以下步骤:窗口分割步骤(S110),将说话人的语音数据按窗口宽度分割成多个窗口;窗口语音情感特征计算步骤(S120),针对所述多个窗口中的每个窗口,计算语音情感特征;以及语音情感变化识别步骤(S130),通过将由至少两个连续窗口构成的窗口集的语音情感特征与存储在语音情感特征变化数据库中的多个语音情感特征变化模板中的每个模板进行比较,以找出与该窗口集的语音情感特征匹配的语音情感特征变化模板,对该窗口集识别说话人的语音情感变化。
-
公开(公告)号:CN101814288B
公开(公告)日:2012-10-03
申请号:CN200910007682.8
申请日:2009-02-20
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 使语音合成时长模型自适应的方法和设备。设备包括:参考模型生成装置,其根据所述语音合成时长模型的分类结构对参考样本数据中每个语音合成单元的样本进行分类,通过计算对应于每个分类的样本集的参考样本数目和参考时长,生成参考语音合成时长模型;和模型自适应装置,其使所述语音合成时长模型中每个语音合成单元的每个时长,适应所述参考语音合成时长模型中相同语音合成单元的、对应于所述时长的分类的参考时长,其中所述适应包括:确定自适应因子λ,其中λ大于0且小于1,并且λ取决于时长的相应样本数目和参考时长的相应样本数目之间的比值;和根据下式计算适应后的时长:适应后的时长=(1-λ)×参考时长+λ×时长。
-
公开(公告)号:CN1956057B
公开(公告)日:2011-01-26
申请号:CN200510117003.4
申请日:2005-10-28
Applicant: 富士通株式会社
Abstract: 本发明为一种基于决策树的语音时长预测装置及方法。包括:输入部,用于输入语言、语音学标注序列;决策树生成部,生成用于预测语音单位时长的决策树;语音单位时长预测部,根据所述的决策树对每个语音单位设定固定时长;并以与所述语音单位相邻的音素上下文、语音单位的韵律边界等级、语音单位的重音等级中的至少一个为基准设定改变语音单位固定时长的变更量;以所述的固定时长和所述固定时长的变更量为基准对输入的语言、语音学标注序列的各个相应的语音单位进行改变;输出部,用于输出语音单位时长预测结果序列。从而能够在语音合成时对语音单位时长进行预测。
-
公开(公告)号:CN100568225C
公开(公告)日:2009-12-09
申请号:CN200610165633.3
申请日:2006-12-08
Applicant: 富士通株式会社
Abstract: 本发明为一种自然语言文本中数字和符号串的文字符号化处理方法及系统,所述的方法包括以下步骤:输入自然语言文本;逐段抽取所述自然语言文本中的数字和符号串;将当前数字和符号串与预存储的模板进行匹配,获得当前数字和符号串所属的模板类型;记录历史数字和符号串的模板类型及相关信息;根据当前数字和符号串所属的模板类型以及当前数字和符号串相邻的历史数字和符号串的模板类型及相关信息对当前数字和符号串进行文字符号化处理。提高了对文本中数字和特殊符号的识别精度和效率。
-
公开(公告)号:CN101196881A
公开(公告)日:2008-06-11
申请号:CN200610165633.3
申请日:2006-12-08
Applicant: 富士通株式会社
Abstract: 本发明为一种自然语言文本中数字和符号串的文字符号化处理方法及系统,所述的方法包括以下步骤:输入自然语言文本;逐段抽取所述自然语言文本中的数字和符号串;将当前数字和符号串与预存储的模板进行匹配,获得当前数字和符号串所属的模板类型;记录历史数字和符号串的模板类型及相关信息;根据当前数字和符号串所属的模板类型以及当前数字和符号串相邻的历史数字和符号串的模板类型及相关信息对当前数字和符号串进行文字符号化处理。提高了对文本中数字和特殊符号的识别精度和效率。
-
公开(公告)号:CN102637433A
公开(公告)日:2012-08-15
申请号:CN201110037314.5
申请日:2011-02-09
Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。
-
公开(公告)号:CN101572083A
公开(公告)日:2009-11-04
申请号:CN200810096066.X
申请日:2008-04-30
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 本发明涉及韵律词组词方法和装置,该方法包括以下步骤:词性获得步骤,获得输入的句子中的各语言学词的词性;词位获得步骤,获得所述输入的句子中的各所述语言学词的在所属韵律词中的各可能候选词位以及处于各可能候选词位的概率;路径获得步骤,获得所有可能顺序组合,各所述可能组合顺序包括所述输入的句子中的每一个所述语言学词的一个可能候选词位;概率计算步骤,根据各所述语言学词处于其可能候选词位的概率,计算所述所有可能顺序组合中的各可能顺序组合的概率;以及最终路径确定步骤,根据所确定出的各可能顺序组合的概率,确定所述输入的句子中的各所述语言学词的词位。
-
-
-
-
-
-
-
-
-