-
公开(公告)号:CN102194454A
公开(公告)日:2011-09-21
申请号:CN201010119995.5
申请日:2010-03-05
Applicant: 富士通株式会社
IPC: G10L15/00
Abstract: 本发明公开了一种语音关键词检测设备和方法,其中所述设备包括:输入装置,用于输入连续语音;识别装置,用于从连续语音中识别候选关键词,并给出相应的置信度,并且识别连续语音中包括的填充音;韵律特征提取装置,用于提取与特定相邻填充音相关的韵律特征;韵律词边界确定装置,用于根据韵律特征来确定特定相邻填充音之间的边界为韵律词边界的概率;置信度调整装置,用于根据与候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率,调整候选关键词的置信度;判决设置,用于判决调整后的候选关键词的置信度是否高于预先设定的阈值;以及输出装置,将调整后的置信度高于预先设定的阈值的候选关键词作为关键词输出。
-
公开(公告)号:CN101930735A
公开(公告)日:2010-12-29
申请号:CN200910150458.4
申请日:2009-06-23
Applicant: 富士通株式会社
Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据说话人说话过程中情感状态之间的转换的条件概率知识,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态。
-
公开(公告)号:CN102637433A
公开(公告)日:2012-08-15
申请号:CN201110037314.5
申请日:2011-02-09
Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。
-
公开(公告)号:CN102637433B
公开(公告)日:2015-11-25
申请号:CN201110037314.5
申请日:2011-02-09
Abstract: 公开了一种生成语音情感模型的方法、设备以及识别语音信号中所承载的情感状态的方法、设备。生成语音情感模型的方法包括以下步骤:通过无监督聚类将标注为同一情感状态的多个情感语音样本聚类成n个子类,每个子类对应于同一情感状态的不同情感表达方式中的一种情感表达方式;以及为每个子类中的情感语音样本生成一个语音情感模型,从而得到分别对应于n个子类的n个语音情感模型,n个语音情感模型用于识别语音信号所承载的不同情感表达方式的情感状态,其中,n为大于或等于2的整数。
-
公开(公告)号:CN102194454B
公开(公告)日:2012-11-28
申请号:CN201010119995.5
申请日:2010-03-05
Applicant: 富士通株式会社
IPC: G10L15/00
Abstract: 本发明涉及语音关键词检测设备和方法,该设备包括:输入装置,其输入连续语音;识别装置,其从连续语音中识别候选关键词,并给出相应的置信度,并且识别连续语音中包括的作为音子或音节的填充音;韵律特征提取装置,其提取与特定相邻填充音相关的韵律特征;韵律词边界确定装置,其根据韵律特征来确定特定相邻填充音之间的边界为韵律词边界的概率;置信度调整装置,其当与候选关键词对应的语音片段所包括的特定相邻填充音之间的边界为韵律词边界的概率越高时,将候选关键词的置信度调整得越小;判决装置,其判决调整后的候选关键词的置信度是否高于预先设定的阈值;以及输出装置,将调整后的置信度高于预先设定的阈值的候选关键词作为关键词输出。
-
公开(公告)号:CN101930735B
公开(公告)日:2012-11-21
申请号:CN200910150458.4
申请日:2009-06-23
Applicant: 富士通株式会社
Abstract: 语音情感识别设备和进行语音情感识别的方法。语音情感识别设备包含:分析装置,其将输入语音的情感特征与多个情感模型进行匹配,以确定多个可能情感状态;概率计算装置,其根据从关于说话人说话过程中情感状态之间的转换的条件概率知识中寻找到的、已确定的情感状态和可能情感状态间的条件概率,计算在说话人先前情感状态的条件下所述可能情感状态的最终概率;和情感判断装置,其从所述可能情感状态中选择最终概率最大的可能情感状态作为所述输入语音的情感状态,其中分析装置进一步被配置为输出可能情感状态的出现概率,并且概率计算装置被进一步配置为结合出现概率来计算最终概率;以及其中最终概率基于出现概率和条件概率的加权和。
-
-
-
-
-