-
公开(公告)号:CN102483918B
公开(公告)日:2014-08-20
申请号:CN200980161199.3
申请日:2009-11-06
Applicant: 株式会社东芝
CPC classification number: G10L15/10 , G01S3/80 , G10L25/84 , G10L2021/02166 , G10L2025/783
Abstract: 本发明提供一种声音识别装置。判定部(13)判定在输入到包括多个麦克风的声音输入部(50)的音中,由于说话者的动作而产生的信号音是否包含规定的强度以上。在判定部(13)的判定是真的情况下,音源方向推测部(14)推测包含所述信号音的音的音源方向。声音识别部(16)判定从所推测出的所述音源方向到来的音是否与预先登记的声音模型一致。
-
公开(公告)号:CN101510425A
公开(公告)日:2009-08-19
申请号:CN200910007438.1
申请日:2009-02-13
Applicant: 株式会社东芝
IPC: G10L15/26
CPC classification number: G10L15/22 , G10L15/20 , G10L2015/223
Abstract: 本发明涉及声音识别装置以及用于执行声音识别的方法。其中,声音识别装置包括:声音识别模块,对声音区间期间的音频信号执行声音识别;距离测量模块,测量用户和声音输入模块之间的当前距离;计算模块,基于声音特性计算推荐距离范围,在该推荐距离范围内估算出S/N比超过第一阈值;以及显示模块,显示推荐距离范围和当前距离。
-
公开(公告)号:CN102483918A
公开(公告)日:2012-05-30
申请号:CN200980161199.3
申请日:2009-11-06
Applicant: 株式会社东芝
IPC: G10L15/28
CPC classification number: G10L15/10 , G01S3/80 , G10L25/84 , G10L2021/02166 , G10L2025/783
Abstract: 本发明提供一种声音识别装置。判定部(13)判定在输入到包括多个麦克风的声音输入部(50)的音中,由于说话者的动作而产生的信号音是否包含规定的强度以上。在判定部(13)的判定是真的情况下,音源方向推测部(14)推测包含所述信号音的音的音源方向。声音识别部(16)判定从所推测出的所述音源方向到来的音是否与预先登记的声音模型一致。
-
公开(公告)号:CN101369274A
公开(公告)日:2009-02-18
申请号:CN200810086276.0
申请日:2008-03-21
Applicant: 株式会社东芝
CPC classification number: H04N5/44543 , G11B27/329 , H04N5/76 , H04N5/765 , H04N21/4147 , H04N21/4334 , H04N21/4335 , H04N21/44222 , H04N21/4622 , H04N21/4828 , H04N21/84
Abstract: 本发明涉及一种用户界面设备和显示方法。本发明中,能够被经常再现的第一内容的内容材料和描述关于能够在预定的时间和日期再现的第二内容的再现的信息的内容信息存储在存储单元中。对应于操作备选内容的时间特性或关于内容材料和/或内容信息的再现状态的特性被确定。对于每种特性按目录显示操作备选内容,并且作为处理备选显示对应于操作备选内容的特性的执行处理。
-
公开(公告)号:CN1837846A
公开(公告)日:2006-09-27
申请号:CN200610071780.4
申请日:2006-03-23
Applicant: 株式会社东芝
CPC classification number: G10L21/0272 , H04R3/005 , H04S7/40
Abstract: 输入包括来自声源的语音的n个声音信号,并且这n个声音信号是在不同的n个点处采集的。将所述声音信号中的每一个分解成多个频率分量,并且获得包括每个频率分量的相位信息的n条频率分解信息。相对于在n条频率分解信息中彼此不同的m对频率分解信息计算在每个频率分量中的一对频率分解信息之间的相位差,并且产生m条二维数据。在二维数据中,将频率函数设置为第一轴,并且将相位差的函数设置为第二轴。从每条二维数据中检测预定图形,并且产生用于表示所述多条声源候选者信息之间的对应关系的对应信息,同时根据每一个图形产生声源候选者信息。根据该声源候选者信息和该对应信息产生声源信息,例如声源的数量、声源的空间存在范围、语音的存在期间、语音的频率分量结构、关于语音的幅度信息、以及语音的符号内容。
-
公开(公告)号:CN101510425B
公开(公告)日:2012-02-29
申请号:CN200910007438.1
申请日:2009-02-13
Applicant: 株式会社东芝
IPC: G10L15/26
CPC classification number: G10L15/22 , G10L15/20 , G10L2015/223
Abstract: 本发明涉及声音识别装置以及用于执行声音识别的方法。其中,声音识别装置包括:声音识别模块,对声音区间期间的音频信号执行声音识别;距离测量模块,测量用户和声音输入模块之间的当前距离;计算模块,基于声音特性计算推荐距离范围,在该推荐距离范围内估算出S/N比超过第一阈值;以及显示模块,显示推荐距离范围和当前距离。
-
公开(公告)号:CN101114447A
公开(公告)日:2008-01-30
申请号:CN200710139019.4
申请日:2007-07-23
Applicant: 株式会社东芝
Inventor: 古贺敏之
CPC classification number: G06F17/2818 , G10L13/00 , G10L15/26
Abstract: 一种语音翻译装置,包括:语音输入单元、语音识别单元、机器翻译单元、参数设置单元、语音合成单元,以及语音输出单元,并且从通过语音识别/机器翻译获得的多个似然确定将被输出的语音数据的语音音量值。对于具有低似然的单词,使得其语音音量值小,从而难以发送给用户,而另一方面,对于具有高似然的单词,使得其语音音量值大,进行特别强调,并发送给所述用户。
-
公开(公告)号:CN1831554A
公开(公告)日:2006-09-13
申请号:CN200610059490.8
申请日:2006-03-13
Applicant: 株式会社东芝
CPC classification number: H04R3/005 , G10L21/0272 , G10L2021/02165
Abstract: 频率分解器分析从麦克风输入到声音信号输入单元的两个振幅数据,且二维数据形成单元对每一频率获得这两个振幅数据之间的相位差。对每一频率的这个相位差给定二维坐标值以形成二维数据。图形探测器分析在X-Y平面上所产生的二维数据以探测图形。声源信息发生器处理所探测到的图形的信息以产生声源信息,所述声源信息包含作为声音信号的发生源的声源的数量、每一声源的空间存在范围、由每一声源产生的声音的时间存在期间、每一源声的成分、每一声源的分离声音和每一源声的符号内容。
-
-
-
-
-
-
-