-
公开(公告)号:CN109377994A
公开(公告)日:2019-02-22
申请号:CN201811311373.5
申请日:2018-11-06
Applicant: 南京邮电大学
IPC: G10L15/22 , G10L13/04 , G10L21/0208 , H04L12/28
CPC classification number: G10L15/22 , G10L13/043 , G10L21/0208 , G10L2015/223 , H04L12/2816
Abstract: 本发明提出一种面向智能家居场景的语音识别控制系统,包括语音采集模块、语音处理模块、服务器、语音合成模块、控制模块和智能家居设备,语音采集模块采集用户输入的语音指令,语音处理模块对采集的语音信号进行去噪处理并将处理后的信号输出到具有语音识别库的服务器中,服务器对语音处理模块处理后的信号进行匹配以得到相应的反馈信号,语音合成模块对服务器输出的反馈信号进行处理生成命令字符,控制模块根据语音合成模块输出的命令字符对智能设备进行控制,智能家居设备反馈其响应情况。本发明能够有效的消除语音命令中的杂音,并且以语音命令代替手动控制和遥控控制,简化了人们的操作,方便了人们的生活方式。
-
公开(公告)号:CN109074239A
公开(公告)日:2018-12-21
申请号:CN201780023818.7
申请日:2017-06-01
Applicant: 松下知识产权经营株式会社
Inventor: 持田哲司
IPC: G06F3/16 , G06F3/0481 , G06F3/0488 , G06F17/28 , G10L13/00 , G10L15/00
CPC classification number: G06F17/289 , G06F3/16 , G10L13/00 , G10L13/043 , G10L15/22 , G10L15/26
Abstract: 本发明提供一种翻译装置以及翻译系统。翻译装置(1)具备操作输入部(11)、声音输入部(12)、翻译信息取得部(16)、信息输出部(17)、执行部(13)以及控制部(14)。向操作输入部(11)输入用户操作。向声音输入部(12)输入声音。翻译信息取得部(16)取得输入到声音输入部(12)的声音的翻译结果。信息输出部(17)输出翻译结果。控制部(14)与信息输出部(17)的翻译结果的输出同步地使执行部(13)执行动作,该动作是基于在与翻译结果对应的声音的输入中输入到操作输入部(11)的用户操作的操作内容的动作。
-
公开(公告)号:CN109068236A
公开(公告)日:2018-12-21
申请号:CN201810728996.6
申请日:2018-07-05
Applicant: 上海塞嘉电子科技有限公司
CPC classification number: H04R3/00 , G10L13/043 , H04R2430/00
Abstract: 本发明公开了一种自动广播设备及方法。该自动广播设备包括:控制组件,控制组件被配置为用于产生控制信号;管理组件,管理组件被配置为能根据控制信号合成音频文件;多通道声卡,多通道声卡具有至少两个通道,管理组件还被配置为能将合成的音频文件安排输送至任意一个通道;至少两组发声组件;音频矩阵,音频矩阵被配置为能将任意一个通道的音频输出输送至任意一组或者多组发声组件。本发明提供的自动广播设备及方法中,能将声卡任意一个通道输出的音频输出输送至任意一组或者多组发声组件,实现任意输入到多个输出的动态输出的自动广播,能动态更改输入输出的对应关系,不必做线路或者配置的变动,真正实现了无人动态自动广播。
-
公开(公告)号:CN109065019A
公开(公告)日:2018-12-21
申请号:CN201810981546.8
申请日:2018-08-27
Applicant: 北京光年无限科技有限公司
Inventor: 贾志强
CPC classification number: G10L13/043 , G10L13/08 , G10L13/10
Abstract: 本发明公开了一种面向智能机器人的故事数据处理方法以及系统。所述方法包括:获取故事文本数据;解析所述故事文本数据,识别故事文本中的对话以及旁白;调用故事数据处理模型,对所述故事文本中的对话以及旁白进行音效处理,生成带有音效的对话及旁白数据;生成并输出匹配所述故事文本的多模态数据,所述多模态数据包括所述带有音效的对话及旁白数据。相较于现有技术,根据本发明的方法及系统,可以将文本形式的故事转化为可多模态展现的多模态数据并对故事中的对话以及旁白的展现方式进行针对性优化,从而大大提高讲述故事时聆听者的用户体验。
-
公开(公告)号:CN108416703A
公开(公告)日:2018-08-17
申请号:CN201810086610.6
申请日:2018-01-29
Applicant: 松下知识产权经营株式会社
CPC classification number: G06F3/167 , G06K9/00771 , G06Q30/0641 , G06Q50/12 , G09B5/02 , G09B19/0092 , G10L13/043 , G10L15/22 , G10L2015/223 , H04N5/76 , H04N9/3141
Abstract: 一种厨房支援系统,具有投影装置、语音识别装置以及控制装置。投影装置朝向进行烹调的烹调空间投影影像。语音识别装置识别所输入的语音的内容。控制装置控制投影装置,使得投影装置对包含表示菜肴的订单内容的订单显示影像的菜肴关联影像进行投影,并且根据语音识别装置的识别结果使投影装置投影的菜肴关联影像变化。
-
公开(公告)号:CN107148554A
公开(公告)日:2017-09-08
申请号:CN201580045985.2
申请日:2015-08-28
Applicant: 英特尔公司
Inventor: P·格拉夫 , A·P·奎里诺西梅斯 , C·A·纳卡楚 , J·M·克里斯蒂安
CPC classification number: G06F3/167 , G01C21/3641 , G10L13/033 , G10L13/043 , G10L15/1822 , G10L15/187 , G10L15/22 , G10L15/265 , G10L17/26 , G10L25/51 , G10L2015/223 , G10L2015/226
Abstract: 公开了提供用户自适应自然语言接口的系统和方法。所公开的实施例可以接收和分析用户输入,以导出当前用户行为数据,包括指示用户输入的特征的数据。基于一次或多次以前用户‑系统交互期间以前记录的以前用户行为数据和当前用户行为数据对用户输入进行分类,以生成用户输入的类别。可以利用机器学习算法对用户输入进行分类。基于用户输入和用户输入的类别选择用户自适应话语。记录用户‑系统交互,用作未来用户‑系统交互中的以前用户行为数据。生成对用户输入的响应,包括从所选择的用户自适应话语合成输出语音。所公开的系统和方法的示例应用在导航系统中提供用户自适应导航指引。
-
公开(公告)号:CN103345467B
公开(公告)日:2017-06-09
申请号:CN201310130953.5
申请日:2010-03-03
Applicant: 独立行政法人情报通信研究机构
CPC classification number: G10L15/265 , G06F17/289 , G10L13/00 , G10L13/043 , G10L15/26 , G10L15/30
Abstract: 在以往的网络型语音翻译系统中,不能根据说话者的属性来变更进行语音识别、翻译或语音合成的装置或模型,因此,在语音识别、翻译或语音合成的各处理中,精度降低、或产生不恰当的输出。在网络型的语音翻译系统中,根据说话者属性来适当地变更进行语音识别的服务器装置或语音识别模型,适当地变更进行翻译的服务器装置或翻译模型,或者适当地变更进行语音合成的服务器装置或语音合成模型,由此,在语音识别、翻译或语音合成的各处理中,提高精度、进行恰当的输出。
-
公开(公告)号:CN106375586A
公开(公告)日:2017-02-01
申请号:CN201610824057.2
申请日:2016-09-14
Applicant: 络达科技股份有限公司
CPC classification number: H04M3/42042 , G10L13/043 , G10L13/08 , H04M1/2745 , H04M1/578 , H04M1/6066 , H04M2250/02 , H04W4/80 , H04M1/72597 , H04M1/72522 , H04M1/7253
Abstract: 本发明公开了移动电子装置与其操作方法,该操作方法包括:由该移动电子装置的一操作系统将一来电号码传送至一无线音频产品,该移动电子装置无线连接至该无线音频产品;该无线音频产品将该来电号码传送至该移动电子装置的一应用程序;该移动电子装置的该应用程序查询对应至该来电号码的一来电者人名;该移动电子装置的该应用程序将该来电者人名传送至该无线音频产品;以及该无线音频产品播放出该来电者人名。
-
公开(公告)号:CN102592633B
公开(公告)日:2014-05-28
申请号:CN201210002348.5
申请日:2006-05-19
Applicant: 吉田健治
Inventor: 吉田健治
IPC: G11B20/00 , G11B27/031 , G11B27/10 , G11B33/10
CPC classification number: G11B27/034 , G10L13/043 , G10L15/00 , G11B20/00 , G11B27/00 , G11B27/105 , G11B33/10 , G11B2020/10546 , G11B2220/17 , H04N1/00403
Abstract: 生成链接表,并对每个点图案将声音信息关联起来,在用扫描器读取上述点图案之际,将与该点图案建立联系的声音信息从扬声器进行重放。由此,就能够在图画书或卡等的表面印刷点图案,并重放与图画书的图案或故事相对应的声音信息,或者重放与卡上所记载的字符相对应的声音信息。另外借助于链接表还能够在新的点图案上将新的声音信息建立联系,或者解除并进行变更等。
-
公开(公告)号:CN102376304B
公开(公告)日:2014-04-30
申请号:CN201010249944.4
申请日:2010-08-10
Applicant: 鸿富锦精密工业(深圳)有限公司 , 鸿海精密工业股份有限公司
IPC: G10L13/08
CPC classification number: G10L13/08 , G10L13/043
Abstract: 一种根据文本内容节奏控制朗读的文本朗读系统,所述文本朗读系统包括:文本读取模块,用于从文本源读取文本内容;文本分析模块,用于分析该文本内容,识别该文本内容所包含的节奏语义;脚本处理模块,用于根据该文本内容所包含的节奏语义,生成节奏控制脚本;文本到语音转换模块;朗读节奏控制模块,用于有节奏的将该文本内容传送给所述文本到所述文本到语音转换模块。本发明还揭示了一种根据文本内容节奏控制朗读的文本朗读方法。根据本发明的技术方案,文本可以按照一定节奏朗读,使用者可以方便自如的依据朗读的内容完成某些特定操作。
-
-
-
-
-
-
-
-
-