-
公开(公告)号:CN108091334A
公开(公告)日:2018-05-29
申请号:CN201710759628.3
申请日:2017-08-30
Applicant: 株式会社东芝
Inventor: 永尾学
CPC classification number: G06K9/00503 , G06K9/481 , G06K9/6256 , G06K9/6274 , G06K2209/01 , G06K2209/21 , G06N3/0445 , G10L15/02 , G10L15/14 , G10L2015/025 , G10L2015/027
Abstract: 本发明涉及识别装置、识别方法以及存储介质。以小的计算开销高精度地对输入信号进行模式识别。识别装置对作为识别对象的输入信号进行模式识别。识别装置具备计算部和过滤部。计算部根据输入信号,计算包括每个符号的得分的多个得分矢量排列而成的得分矢量列。过滤部使计算出的得分矢量列中的一部分得分矢量通过。过滤部使与最好的得分对应的代表符号是识别对象符号的第1得分矢量、代表符号是对象外符号且代表符号的得分比第1阈值差的第2得分矢量、以及代表符号是对象外符号且代表符号的得分是第1阈值或者比第1阈值好的第3得分矢量中的、满足预先决定的第1条件的第3得分矢量通过。
-
公开(公告)号:CN1842151A
公开(公告)日:2006-10-04
申请号:CN200610066969.4
申请日:2006-03-30
Applicant: 株式会社东芝
IPC: H04N5/76 , H04N5/91 , G11B20/10 , G11B27/10 , G11B27/034
Abstract: 提供一种信息处理装置,在该信息处理装置中,对于待记录和存储的视频/音频数据,在不需要每次执行手动操作的情况下,能够执行确定适合于观看和收听的分割点和控制点的决定及给出相关信息。所述信息处理装置包括记录介质90、视频数据获取单元48、视频数据指定单元47、音频数据分离单元25、关键字创建单元31、关键字相关数据获取单元55和关键字数据管理单元10。当创建关键字同时指定第一音频数据中的片段时,存储基于附近分割点和控制点的名称和属性信息,并且当从第二音频数据中检测到类似于所述关键字的音频模式的音频片段时,根据所述存储的属性信息,基于所述检测片段的开始端和结束端确定分割点和控制点,并且为所述分割的片段、控制点或所述整个音频数据设置所述存储的名称或根据命名方法给出的名称。
-
公开(公告)号:CN108091334B
公开(公告)日:2021-12-03
申请号:CN201710759628.3
申请日:2017-08-30
Applicant: 株式会社东芝
Inventor: 永尾学
Abstract: 本发明涉及识别装置、识别方法以及存储介质。以小的计算开销高精度地对输入信号进行模式识别。识别装置对作为识别对象的输入信号进行模式识别。识别装置具备计算部和过滤部。计算部根据输入信号,计算包括每个符号的得分的多个得分矢量排列而成的得分矢量列。过滤部使计算出的得分矢量列中的一部分得分矢量通过。过滤部使与最好的得分对应的代表符号是识别对象符号的第1得分矢量、代表符号是对象外符号且代表符号的得分比第1阈值差的第2得分矢量、以及代表符号是对象外符号且代表符号的得分是第1阈值或者比第1阈值好的第3得分矢量中的、满足预先决定的第1条件的第3得分矢量通过。
-
公开(公告)号:CN108074562B
公开(公告)日:2021-12-03
申请号:CN201710759611.8
申请日:2017-08-30
Applicant: 株式会社东芝
IPC: G10L15/06 , G10L15/183 , G10L15/187 , G10L17/00 , G10L25/63
Abstract: 提供一种语音识别装置、语音识别方法以及存储介质,识别语音信号中所包含的语言信息以及语言信息中所附带的副语言信息和/或非语言信息。实施方式的语音识别装置具备计算部、搜索部、附加符号取得部和输出部。搜索部通过搜索对得分矢量序列中的似然度高的声学得分进行追溯的输入符号的路径而生成输入符号串,根据输入符号串中所包含的输入符号之中的表示识别对象的语言信息的识别对象符号,生成表示语音信号的识别结果的输出符号。附加符号取得部从输入符号串中的与输出符号对应的范围中所包含的输入符号中,取得表示副语言信息和/或非语言信息的附加符号。输出部将输出符号与所取得的附加符号对应关联地进行输出。
-
公开(公告)号:CN108074562A
公开(公告)日:2018-05-25
申请号:CN201710759611.8
申请日:2017-08-30
Applicant: 株式会社东芝
IPC: G10L15/06 , G10L15/183 , G10L15/187 , G10L17/00 , G10L25/63
Abstract: 提供一种语音识别装置、语音识别方法以及存储介质,识别语音信号中所包含的语言信息以及语言信息中所附带的副语言信息和/或非语言信息。实施方式的语音识别装置具备计算部、搜索部、附加符号取得部和输出部。搜索部通过搜索对得分矢量序列中的似然度高的声学得分进行追溯的输入符号的路径而生成输入符号串,根据输入符号串中所包含的输入符号之中的表示识别对象的语言信息的识别对象符号,生成表示语音信号的识别结果的输出符号。附加符号取得部从输入符号串中的与输出符号对应的范围中所包含的输入符号中,取得表示副语言信息和/或非语言信息的附加符号。输出部将输出符号与所取得的附加符号对应关联地进行输出。
-
公开(公告)号:CN101155291A
公开(公告)日:2008-04-02
申请号:CN200710147231.5
申请日:2007-08-30
Applicant: 株式会社东芝
Inventor: 永尾学
CPC classification number: G06F17/289 , G10L15/26 , G10L15/28
Abstract: 在语音翻译设备中,对应存储单元在其中存储彼此关联的终端的标识符和终端中使用的使用语言。接收单元从一个终端接收源语音。生成单元从对应存储单元中获取使用语言,并且通过将每个所获取的使用语言作为目标语言生成经翻译的语音。当用任何一个目标语言生成经翻译的语音时,确定单元确定是否已经用所有的目标语言生成经翻译的语音。如果已经用所有的目标语言生成经翻译的语音,则输出处理单元输出经翻译的语音。发送单元将经翻译的语音发送到每个终端。
-
-
-
-
-