-
公开(公告)号:CN101369424A
公开(公告)日:2009-02-18
申请号:CN200810171465.8
申请日:2008-08-15
Applicant: 株式会社东芝
Inventor: 益子贵史
IPC: G10L15/02
Abstract: 本发明涉及一种特征提取装置,其包括:频谱计算器,其计算帧的对数频谱,所述对数频谱包括在对数频率轴上等间隔地从输入语音信号中获得的频率分量;函数计算器,其根据在每个时刻计算的所述对数频谱的序列,计算在该时刻的对数频谱和在该时刻的前后某一时间宽度中包括的一个或者多个时刻的对数频谱之间的互相关函数;以及特征提取器,其提取所述互相关函数的集合,作为该帧的局部相对基频模式特征。
-
公开(公告)号:CN108573713B
公开(公告)日:2022-01-11
申请号:CN201710760251.3
申请日:2017-08-30
Applicant: 株式会社东芝
Inventor: 益子贵史
Abstract: 本发明涉及语音识别装置、语音识别方法以及存储介质,能够高精度地进行识别。语音识别装置具备计算部和搜索部。搜索部通过搜索搜索模型,检测对得到得分向量列中的可能的声音得分的输入记号进行追踪的路径,输出对搜索模型中的检测出的路径分配的输出记号。记号集合包括表示识别对象的音韵的识别对象记号和表示填充词等的附加记号而作为输入记号。搜索模型包括被分配有输入记号串和输出记号的多个路径。搜索部在受理了附加记号作为得到可能的声音得分的输入记号的情况下,从包括所受理的附加记号的得分向量的下个得分向量开始搜索与新的输出记号对应的路径。
-
公开(公告)号:CN101051462A
公开(公告)日:2007-10-10
申请号:CN200710091473.7
申请日:2007-03-30
Applicant: 株式会社东芝
CPC classification number: G10L15/20
Abstract: 噪声环境存储单元,在其中存储用于补偿语音的特征矢量的补偿矢量。特征提取单元,在多个帧中的每个帧中提取语音的特征矢量。噪声环境序列估计单元,根据特征矢量序列和相似性程度估计噪声环境序列。计算单元,根据在噪声环境存储单元内存在的补偿矢量获得与在估计的噪声环境序列内的每个噪声环境对应的补偿矢量。补偿单元根据所获得的补偿矢量补偿语音的所提取特征矢量。
-
公开(公告)号:CN101521009A
公开(公告)日:2009-09-02
申请号:CN200910118520.1
申请日:2009-02-26
Applicant: 株式会社东芝
IPC: G10L15/10
Abstract: 一种特征提取装置,包括:谱计算单元,其基于输入语音信号为以规则时间间隔限定的帧中的每一个帧计算具有在对数频率尺度上的规则间隔处获得的频率分量的频率谱,并由此产生所述频率谱的时间序列;互相关系数计算单元,其对于所述帧中的每一个目标帧计算为邻近所述目标帧并彼此间隔预定帧宽度的两个不同的帧而计算的频率谱之间的互相关系数;以及移动量预测单元,其使用所述互相关系数来预测在对数频率尺度上所述频率谱相对于所述预定帧宽度的移动量。
-
公开(公告)号:CN101051461A
公开(公告)日:2007-10-10
申请号:CN200710088572.X
申请日:2007-03-16
Applicant: 株式会社东芝
IPC: G10L15/20
CPC classification number: G10L15/20 , G10L15/02 , G10L15/065
Abstract: 本发明提供一种特征向量补偿装置和特征向量补偿方法。其中,特征提取单元提取输入语音的特征向量。相似性计算单元根据特征向量,针对多个噪声环境中的每一个计算相似度。补偿向量计算单元从存储单元中获取第一补偿向量,根据第一补偿向量计算第二补偿向量,并且通过以相似度作为加权系数使第二补偿向量加权相加,来计算第三补偿向量。补偿单元根据第三补偿向量来补偿特征向量。
-
公开(公告)号:CN1750120A
公开(公告)日:2006-03-22
申请号:CN200510091755.8
申请日:2005-08-17
Applicant: 株式会社东芝
CPC classification number: G06F17/30861 , G10L17/00
Abstract: 一种索引设备,包括:获取单元,用于获得声信号;划分单元,用于将声信号划分为多个段;声模型生成单元,用于为每个段生成声模型;可靠性确定单元,用于确定声模型的可靠性;相似性矢量生成单元,用于根据可靠性,生成具有作为预定段的声模型与每个其它段的声信号之间的相似性的元素的相似性矢量;分组单元,用于将由相似性矢量生成单元生成的相似性矢量分组;以及索引单元,用于根据经过分组的相似性矢量,对声信号进行索引。
-
公开(公告)号:CN108573713A
公开(公告)日:2018-09-25
申请号:CN201710760251.3
申请日:2017-08-30
Applicant: 株式会社东芝
Inventor: 益子贵史
Abstract: 本发明涉及语音识别装置、语音识别方法以及存储介质,能够高精度地进行识别。语音识别装置具备计算部和搜索部。搜索部通过搜索搜索模型,检测对得到得分向量列中的可能的声音得分的输入记号进行追踪的路径,输出对搜索模型中的检测出的路径分配的输出记号。记号集合包括表示识别对象的音韵的识别对象记号和表示填充词等的附加记号而作为输入记号。搜索模型包括被分配有输入记号串和输出记号的多个路径。搜索部在受理了附加记号作为得到可能的声音得分的输入记号的情况下,从包括所受理的附加记号的得分向量的下个得分向量开始搜索与新的输出记号对应的路径。
-
公开(公告)号:CN108073980A
公开(公告)日:2018-05-25
申请号:CN201710752959.4
申请日:2017-08-29
Applicant: 株式会社东芝
Inventor: 益子贵史
IPC: G06N3/04
CPC classification number: G06N3/0445 , G06F17/16 , G06K9/36
Abstract: 一种模式识别装置以及模式识别方法。本发明的实施方式涉及模式识别装置以及模式识别方法。实现高效地削减计算量。在实施方式的模式识别装置中,作为构成递归型神经网络的中间层的RNN层包括输入变换部和RNN处理部。RNN层的输入变换部针对每个阶段进行针对输入矢量和递归输入矢量的变换,计算比所述输入矢量的维数与所述递归输入矢量的维数之和小的维数的变换矢量并输出的步骤,其中该输入矢量由从所述输入层输出的特征矢量或者下位的所述RNN层所包括的所述RNN处理部的输出构成,该递归输入矢量由该RNN层所包括的所述RNN处理部的之前阶段的输出构成。RNN层的RNN处理部针对每个阶段根据由该RNN层所包括的输入变换部计算出的变换矢量计算RNN输出矢量并输出。
-
公开(公告)号:CN115564026A
公开(公告)日:2023-01-03
申请号:CN202211302084.5
申请日:2017-08-29
Applicant: 株式会社东芝
Inventor: 益子贵史
Abstract: 一种模式识别装置以及模式识别方法。本发明的实施方式涉及模式识别装置以及模式识别方法。实现高效地削减计算量。在实施方式的模式识别装置中,作为构成递归型神经网络的中间层的RNN层包括输入变换部和RNN处理部。RNN层的输入变换部针对每个阶段进行针对输入矢量和递归输入矢量的变换,计算比所述输入矢量的维数与所述递归输入矢量的维数之和小的维数的变换矢量并输出的步骤,其中该输入矢量由从所述输入层输出的特征矢量或者下位的所述RNN层所包括的所述RNN处理部的输出构成,该递归输入矢量由该RNN层所包括的所述RNN处理部的之前阶段的输出构成。RNN层的RNN处理部针对每个阶段根据由该RNN层所包括的输入变换部计算出的变换矢量计算RNN输出矢量并输出。
-
公开(公告)号:CN103514153A
公开(公告)日:2014-01-15
申请号:CN201310130904.1
申请日:2013-04-16
Applicant: 株式会社东芝
IPC: G06F17/28
CPC classification number: G06F17/289 , G06F17/2827 , G06F17/2836 , G10L15/005 , G10L15/26 , Y10S707/99934
Abstract: 根据一个实施例,语音翻译装置(100)包括语音识别单元(102)、翻译单元(103)、搜索单元(106)和选择单元(108)。语音识别单元(102)连续地执行语音识别以获得第一语言字串。翻译单元(103)将第一语言字串翻译成第二语言字串。搜索单元(106)搜索至少一个相似例,并获取相似例和翻译例。选择单元(108)根据用户指令选择与相似例相关联的第一语言字串和与翻译例相关联的第二语言字串中的至少一个,作为所选择的字串。
-
-
-
-
-
-
-
-
-