-
公开(公告)号:CN103902600B
公开(公告)日:2017-12-01
申请号:CN201210581696.2
申请日:2012-12-27
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本公开提供一种关键词列表形成装置和方法以及电子设备。该关键词列表形成装置包括:初始关键词形成单元,针对每个多音字,计算多音字的上下文词语对于多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为初始关键词;关键词划分单元,根据初始关键词与该多音字的位置关系,将其划分为多个关键词组;和冗余关键词去除单元,针对包括至少两个初始关键词的每个关键词组,基于关键词组中的初始关键词共同出现的次数以及每个初始关键词的区分度来确定并删除冗余的初始关键词,从而形成关键词列表。本公开可获得如下效果之一:提高在以关键词确定多音字发音时的计算速度;降低多音字确定时的出错概率;提高语音合成处理的效率。
-
公开(公告)号:CN103902600A
公开(公告)日:2014-07-02
申请号:CN201210581696.2
申请日:2012-12-27
Applicant: 富士通株式会社
IPC: G06F17/30
CPC classification number: G06F17/30755
Abstract: 本公开提供一种关键词列表形成装置和方法以及电子设备。该关键词列表形成装置包括:初始关键词形成单元,针对每个多音字,计算多音字的上下文词语对于多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为初始关键词;关键词划分单元,根据初始关键词与该多音字的位置关系,将其划分为多个关键词组;和冗余关键词去除单元,针对包括至少两个初始关键词的每个关键词组,基于关键词组中的初始关键词共同出现的次数以及每个初始关键词的区分度来确定并删除冗余的初始关键词,从而形成关键词列表。本公开可获得如下效果之一:提高在以关键词确定多音字发音时的计算速度;降低多音字确定时的出错概率;提高语音合成处理的效率。
-