-
公开(公告)号:CN111754995A
公开(公告)日:2020-10-09
申请号:CN201910248475.5
申请日:2019-03-29
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 本发明提供对阈值的调整进行支持以便能针对预先决定的多个识别对象语分别设定适当阈值的阈值调整装置、阈值调整方法及记录介质。阈值调整装置具备:声音识别部;评价部,对声音识别部输入将针对预先决定的多个识别对象语分别独立地设定的多个阈值作为要素的阈值列表和评价用声音,基于声音识别部输出的针对评价用声音的识别结果,计算表示识别精度的评价值,识别精度是由使用了阈值列表的声音识别部针对多个识别对象语的每一个的识别精度;和显示控制部,使显示装置显示用于调整与任意的识别对象语对应的阈值的阈值调整画面。阈值调整画面包括将评价值与理想值一并提示的精度一览画面。
-
公开(公告)号:CN109791525B
公开(公告)日:2023-03-10
申请号:CN201780058171.1
申请日:2017-09-19
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
IPC: G06F13/00 , G06F40/279 , G06F40/186 , H04L51/02 , G06F40/166 , G06F40/30
Abstract: 实施方式的交流装置具有解释部、存储部及生成部。上述解释部解释发给对象用户的消息的内容。上述存储部存储与上述对象用户的人物特征有关的信息。上述生成部,基于由上述解释部所解释的上述发给对象用户的消息的内容及存储于上述存储部的与上述对象用户的人物特征有关的信息,生成对上述对象用户的应答进行模拟而获得的应答消息。
-
公开(公告)号:CN109791525A
公开(公告)日:2019-05-21
申请号:CN201780058171.1
申请日:2017-09-19
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 实施方式的交流装置具有解释部、存储部及生成部。上述解释部解释发给对象用户的消息的内容。上述存储部存储与上述对象用户的人物特征有关的信息。上述生成部,基于由上述解释部所解释的上述发给对象用户的消息的内容及存储于上述存储部的与上述对象用户的人物特征有关的信息,生成对上述对象用户的应答进行模拟而获得的应答消息。
-
公开(公告)号:CN105426362A
公开(公告)日:2016-03-23
申请号:CN201510566882.2
申请日:2015-09-08
Applicant: 株式会社东芝 , 东芝解决方案株式会社
CPC classification number: G06F17/289 , G06F17/2276 , G06F17/2775 , G10L15/26
Abstract: 本发明的实施方式涉及语音翻译装置、方法及程序。目的在于提供能够实现顺畅的语音对话的语音翻译装置、方法及程序。本实施方式所涉及的语音翻译装置包含语音识别部、检测部、变换部及翻译部。语音识别部对基于第1语言的语音进行语音识别,生成识别结果字符串。检测部从上述识别结果字符串检测适于翻译的翻译单位,生成基于该翻译单位将该识别结果字符串分割后的翻译单位字符串。变换部将上述翻译单位字符串变换为适于机器翻译的表达即变换字符串。翻译部将上述变换字符串翻译为与上述第1语言不同的第2语言,生成翻译字符串。
-
公开(公告)号:CN100431342C
公开(公告)日:2008-11-05
申请号:CN200410057497.7
申请日:2004-08-13
Applicant: 株式会社东芝
CPC classification number: G10L25/00 , H04N5/44504 , H04N5/60 , H04N5/775 , H04N5/85 , H04N21/42203 , H04N21/4312 , H04N21/4394 , H04N21/4884
Abstract: 一种隐藏字幕显示控制器,用来与控制音频信号语音对应的隐藏字幕的显示模式,所述控制器包括:用来分析语音的语音品质的分析单元;检查单元配置为根据分析单元的分析结果,按照给定的一条规则,检查语音收听电平;确定单元按照检查单元的检查结果,确定显示模式。
-
公开(公告)号:CN1842151A
公开(公告)日:2006-10-04
申请号:CN200610066969.4
申请日:2006-03-30
Applicant: 株式会社东芝
IPC: H04N5/76 , H04N5/91 , G11B20/10 , G11B27/10 , G11B27/034
Abstract: 提供一种信息处理装置,在该信息处理装置中,对于待记录和存储的视频/音频数据,在不需要每次执行手动操作的情况下,能够执行确定适合于观看和收听的分割点和控制点的决定及给出相关信息。所述信息处理装置包括记录介质90、视频数据获取单元48、视频数据指定单元47、音频数据分离单元25、关键字创建单元31、关键字相关数据获取单元55和关键字数据管理单元10。当创建关键字同时指定第一音频数据中的片段时,存储基于附近分割点和控制点的名称和属性信息,并且当从第二音频数据中检测到类似于所述关键字的音频模式的音频片段时,根据所述存储的属性信息,基于所述检测片段的开始端和结束端确定分割点和控制点,并且为所述分割的片段、控制点或所述整个音频数据设置所述存储的名称或根据命名方法给出的名称。
-
公开(公告)号:CN111754995B
公开(公告)日:2024-06-04
申请号:CN201910248475.5
申请日:2019-03-29
Applicant: 株式会社东芝 , 东芝数字解决方案株式会社
Abstract: 本发明提供对阈值的调整进行支持以便能针对预先决定的多个识别对象语分别设定适当阈值的阈值调整装置、阈值调整方法及记录介质。阈值调整装置具备:声音识别部;评价部,对声音识别部输入将针对预先决定的多个识别对象语分别独立地设定的多个阈值作为要素的阈值列表和评价用声音,基于声音识别部输出的针对评价用声音的识别结果,计算表示识别精度的评价值,识别精度是由使用了阈值列表的声音识别部针对多个识别对象语的每一个的识别精度;和显示控制部,使显示装置显示用于调整与任意的识别对象语对应的阈值的阈值调整画面。阈值调整画面包括将评价值与理想值一并提示的精度一览画面。
-
-
公开(公告)号:CN1581951A
公开(公告)日:2005-02-16
申请号:CN200410057493.9
申请日:2004-08-13
Applicant: 株式会社东芝
CPC classification number: G10L15/26
Abstract: 一种使用视频-音频信号的信息处理设备,包括:语音量放单元,用于从视频-音频信号重放语音信号;语音识别单元,用于对语音信号进行语音识别;文本生成器,用于通过使用语音识别单元的语音识别结果,生成具有语言要素和用于与语音信号的重放同步的时间信息的语言文本;呈现单元,用于有选择地与语音重放单元重放的语音信号同步呈现语言要素和时间信息。
-
公开(公告)号:CN1581282A
公开(公告)日:2005-02-16
申请号:CN200410057497.7
申请日:2004-08-13
Applicant: 株式会社东芝
CPC classification number: G10L25/00 , H04N5/44504 , H04N5/60 , H04N5/775 , H04N5/85 , H04N21/42203 , H04N21/4312 , H04N21/4394 , H04N21/4884
Abstract: 一种隐藏字幕显示控制器,用来与控制音频信号语音对应的隐藏字幕的显示模式,所述控制器包括:用来分析语音的语音品质的分析单元;检查单元配置为根据分析单元的分析结果,按照给定的一条规则,检查语音收听电平;确定单元按照检查单元的检查结果,确定显示模式。
-
-
-
-
-
-
-
-
-