-
公开(公告)号:CN101814288A
公开(公告)日:2010-08-25
申请号:CN200910007682.8
申请日:2009-02-20
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 使语音合成时长模型自适应的方法和设备。设备包括:参考模型生成装置,其根据所述语音合成时长模型的分类结构对参考样本数据中每个语音合成单元的样本进行分类,通过计算对应于每个分类的样本集的参考样本数目和参考时长,生成参考语音合成时长模型;和模型自适应装置,其使所述语音合成时长模型中每个语音合成单元的每个时长,适应所述参考语音合成时长模型中相同语音合成单元的、对应于所述时长的分类的参考时长。
-
公开(公告)号:CN101685633A
公开(公告)日:2010-03-31
申请号:CN200810166002.2
申请日:2008-09-28
Applicant: 富士通株式会社
Abstract: 本发明提供基于韵律参照的语音合成装置和方法。该语音合成装置包括:韵律参数获取部,其通过对按包括自然人朗读待合成文本在内的方式而获得的录音文件进行分析,或者对以预定标注标准对待合成文本进行韵律参数标注而获得的韵律参数标注文件进行分析,来获取自然韵律参数或近似自然韵律参数;和音声作成部,其以该自然韵律参数或近似自然韵律参数作为参照,针对该待合成文本从预录语音库中选择相应的语音合成单元,并对所述语音合成单元进行拼接合成,以产生对应于该待合成文本的合成语音文件。根据本发明的语音合成装置和方法,可以根据用户的要求生成富有感情色彩且抑扬顿挫程度与自然语音非常接近的高自然度的合成语音。
-
公开(公告)号:CN102880621B
公开(公告)日:2017-03-01
申请号:CN201110203979.9
申请日:2011-07-14
Applicant: 富士通株式会社
IPC: G06F17/30
Abstract: 本发明涉及用于从时间序列提取与基准序列相似的子时间序列的方法和装置。其中,用于从时间序列提取与基准序列相似的子时间序列的方法包括:分别根据时间序列和基准序列的变化趋势对时间序列和基准序列进行变换;将变换后的时间序列分割成多个子时间序列;针对多个子时间序列中的每个子时间序列,计算每个子时间序列与变换后的基准序列之间的编辑距离;以及根据计算出的编辑距离从多个子时间序列中提取与基准序列相似的子时间序列。
-
公开(公告)号:CN102402713B
公开(公告)日:2015-11-25
申请号:CN201010280239.0
申请日:2010-09-09
Applicant: 富士通株式会社
IPC: G06N99/00
Abstract: 本发明公开了一种机器学习方法和装置。所述机器学习方法包括:利用不同的方法从未标注的数据集中自动标注和获取n个不同的种子集合S1,S2,...,Sn,n是自然数且n≥2;利用所述n个已自动标注的种子集合S1,S2,...,Sn分别训练相应的n个分类器C1,C2,...,Cn;对于所述n个已自动标注的种子集合中的每个种子集合Si,i=1,2,...,n,利用所述n个分类器中的除由该种子集合Si训练的分类器Ci之外的部分或全部分类器对该种子集合Si进行验证;以及利用经验证的所述n个种子集合S1,S2,...,Sn分别再次训练所述相应的n个分类器C1,C2,...,Cn。
-
公开(公告)号:CN102435990B
公开(公告)日:2014-05-14
申请号:CN201010505219.9
申请日:2010-09-29
Applicant: 富士通株式会社
Abstract: 本发明公开一种射频识别RFID标签定位方法和装置。所述方法包括:使用RFID阅读器的天线分别在多个指定的发射功率下读取线性排列的对象标签预定次数;记录每个对象标签在每一个指定的发射功率下被所述天线成功读取的次数;计算每个对象标签被所述天线成功读取的次数之和;通过对每个对象标签被成功读取的次数之和进行排序,来确定各个对象标签相对于所述天线的排列顺序;计算每个对象标签相对于所述天线的归一化读取概率;以及通过根据每个对象标签相对于所述天线的归一化读取概率查询读取概率地图,来确定每个对象标签相对于所述天线的距离.其中,读取概率地图记录标签相对于天线的归一化读取概率与标签相对于天线的距离的对应关系。
-
-
公开(公告)号:CN102142253B
公开(公告)日:2013-05-29
申请号:CN201010104779.3
申请日:2010-01-29
Applicant: 富士通株式会社
Abstract: 本发明提供了语音情感识别设备及方法。一种语音情感识别设备,包括:情感识别单元,用于将说话者的语音的当前情感状态识别为初步的情感状态;以及置信度判断单元,用于计算初步的情感状态的置信度,并利用该置信度判断初步的情感状态是否可信,如果初步的情感状态被判断为可信,则将该初步的情感状态确定为最终的情感状态,并输出该最终的情感状态。本发明通过对语音情感状态的识别结果进行置信度判断并根据判断结果来确定最终的情感状态,能够提高语音情感状态的识别结果的准确度。
-
公开(公告)号:CN102099853B
公开(公告)日:2012-10-10
申请号:CN200980127959.9
申请日:2009-03-16
Applicant: 富士通株式会社
CPC classification number: G10L17/26
Abstract: 提供了一种用于从说话人的语音数据中识别说话人的语音情感变化的设备和方法,其中该方法包括以下步骤:窗口分割步骤(S110),将说话人的语音数据按窗口宽度分割成多个窗口;窗口语音情感特征计算步骤(S120),针对所述多个窗口中的每个窗口,计算语音情感特征;以及语音情感变化识别步骤(S130),通过将由至少两个连续窗口构成的窗口集的语音情感特征与存储在语音情感特征变化数据库中的多个语音情感特征变化模板中的每个模板进行比较,以找出与该窗口集的语音情感特征匹配的语音情感特征变化模板,对该窗口集识别说话人的语音情感变化。
-
公开(公告)号:CN101814288B
公开(公告)日:2012-10-03
申请号:CN200910007682.8
申请日:2009-02-20
Applicant: 富士通株式会社
IPC: G10L13/08
Abstract: 使语音合成时长模型自适应的方法和设备。设备包括:参考模型生成装置,其根据所述语音合成时长模型的分类结构对参考样本数据中每个语音合成单元的样本进行分类,通过计算对应于每个分类的样本集的参考样本数目和参考时长,生成参考语音合成时长模型;和模型自适应装置,其使所述语音合成时长模型中每个语音合成单元的每个时长,适应所述参考语音合成时长模型中相同语音合成单元的、对应于所述时长的分类的参考时长,其中所述适应包括:确定自适应因子λ,其中λ大于0且小于1,并且λ取决于时长的相应样本数目和参考时长的相应样本数目之间的比值;和根据下式计算适应后的时长:适应后的时长=(1-λ)×参考时长+λ×时长。
-
公开(公告)号:CN102087694A
公开(公告)日:2011-06-08
申请号:CN200910253635.1
申请日:2009-12-07
Applicant: 富士通株式会社
IPC: G06K7/00
Abstract: 本发明公开了一种标签位置识别系统及方法和标签方位识别系统及方法。根据本发明的标签位置识别系统包括:识读率特征数据库,配置为存储标签的识读率特征与标签的位置之间的对应关系;识读率记录单元,配置为记录标签的识读率;识读率特征变化提取单元,配置为根据识读率记录单元所记录的识读率提取标签的识读率特征变化;识读率特征变化比较单元,配置为通过比较识读率特征变化提取单元所提取的识读率特征变化与识读率特征数据库中存储的识读率特征,确定待识别的标签可能所处的区间;以及位置计算单元,配置为根据识读率特征变化比较单元确定的待识别的标签可能所处的区间和所述区间的前一区间的识读率确定待识别的标签的位置。
-
-
-
-
-
-
-
-
-