-
公开(公告)号:CN103298529A
公开(公告)日:2013-09-11
申请号:CN201180055382.2
申请日:2011-11-17
Applicant: 斯蒂尔塞瑞斯有限责任公司
Inventor: M·阿洛森
CPC classification number: A63F13/355 , A63F13/02 , A63F13/06 , A63F13/10 , A63F13/12 , A63F13/215 , A63F13/25 , A63F13/335 , A63F13/35 , A63F13/40 , A63F13/54 , A63F13/79 , A63F13/87 , A63F2300/308 , A63F2300/538 , A63F2300/572 , A63F2300/6063 , G06F3/0489 , G06F9/454 , G06F17/275 , G06F17/289 , G10L13/043
Abstract: 一种合并本公开的教导的系统包括例如计算设备,所述计算设备具有控制器以:获得被输入到可操作地与计算设备耦接的第一附件的用户输入,其中该第一附件提供用于与视频游戏的用户交互的用户接口;基于用户输入的预期接收者的身份确定预期接收者的语言;访问包括与视频游戏相关联的多个词的多语言库;将用户输入与多语言库的多个词中的一个或多个词匹配,以便以确定的预期接收者的语言生成翻译的消息;以及将翻译的消息提供到第二附件以实时地呈现给预期的接收者。公开了附加的实施例。
-
公开(公告)号:CN102623029A
公开(公告)日:2012-08-01
申请号:CN201210002866.7
申请日:2006-05-19
Applicant: 吉田健治
Inventor: 吉田健治
IPC: G11B20/00 , G11B27/031 , G11B27/10 , G11B33/10
CPC classification number: G11B27/034 , G10L13/043 , G10L15/00 , G11B20/00 , G11B27/00 , G11B27/105 , G11B33/10 , G11B2020/10546 , G11B2220/17 , H04N1/00403
Abstract: 生成链接表,并对每个点图案将声音信息关联起来,在用扫描器读取上述点图案之际,将与该点图案建立联系的声音信息从扬声器进行重放。由此,就能够在图画书或卡等的表面印刷点图案,并重放与图画书的图案或故事相对应的声音信息,或者重放与卡上所记载的字符相对应的声音信息。另外借助于链接表还能够在新的点图案上将新的声音信息建立联系,或者解除并进行变更等。
-
公开(公告)号:CN102549653A
公开(公告)日:2012-07-04
申请号:CN201080043645.3
申请日:2010-03-03
Applicant: 独立行政法人情报通信研究机构
CPC classification number: G10L15/265 , G06F17/289 , G10L13/00 , G10L13/043 , G10L15/26 , G10L15/30
Abstract: 在以往的网络型语音翻译系统中,不能根据说话者的属性来变更进行语音识别、翻译或语音合成的装置或模型,因此,在语音识别、翻译或语音合成的各处理中,精度降低、或产生不恰当的输出。在网络型的语音翻译系统中,根据说话者属性来适当地变更进行语音识别的服务器装置或语音识别模型,适当地变更进行翻译的服务器装置或翻译模型,或者适当地变更进行语音合成的服务器装置或语音合成模型,由此,在语音识别、翻译或语音合成的各处理中,提高精度、进行恰当的输出。
-
公开(公告)号:CN101996627A
公开(公告)日:2011-03-30
申请号:CN201010254757.5
申请日:2010-08-13
Applicant: 索尼公司
CPC classification number: G10L13/08 , G10L13/043 , G10L21/02 , G10L21/055 , G10L25/81
Abstract: 本发明提供了一种语音处理装置、语音处理方法和程序,所述语音处理装置包括:数据获取单元,用于获取定义音乐进行中一个或更多个时间点或者一个或更多个时间段的特性的音乐进行数据;确定单元,用于通过采用数据获取单元获取的音乐进行数据确定要在播放音乐期间输出语音的输出时间点;以及音频输出单元,用于在播放音乐期间在确定单元确定的输出时间点输出语音。
-
公开(公告)号:CN109509470A
公开(公告)日:2019-03-22
申请号:CN201811508635.7
申请日:2018-12-11
Applicant: 平安科技(深圳)有限公司
CPC classification number: G10L15/22 , G10L13/043 , G10L13/047 , G10L15/265 , G10L17/22 , G10L17/26 , G10L2015/223
Abstract: 本发明属于计算机技术领域,尤其涉及一种语音交互方法、装置、计算机可读存储介质及终端设备。所述方法对预设的麦克风采集的第一语音流进行唤醒词检测;若在所述第一语音流中检测到预设的唤醒词集合中的任意一个唤醒词,则对麦克风采集的第二语音流进行语音识别,得到与所述第二语音流对应的文本信息,所述第一语音流为在唤醒词检测成功之前采集的语音流,所述第二语音流为在唤醒词检测成功之后采集的语音流;在数据库中查询与所述文本信息对应的回复信息;对所述回复信息进行语音合成,生成回复语音,并通过预设的音箱播报所述回复语音。通过本发明,可以对用户所说的话自动进行回复,模拟出真实沟通场景的互动性,大大缓解了用户的孤独感。
-
公开(公告)号:CN109000635A
公开(公告)日:2018-12-14
申请号:CN201810566624.8
申请日:2018-06-05
Applicant: 本田技研工业株式会社
IPC: G01C21/00
CPC classification number: G06K9/00335 , G06K9/00302 , G07C5/06 , G10L13/033 , G10L13/043 , G10L15/22 , G10L25/63
Abstract: 本发明提供一种信息提供装置及信息提供方法,能够一方面减轻或消除车辆的用户的不适感,一方面根据驾驶负荷提供信息。信息提供装置(2)包括:情绪确定部(100),确定车辆的虚拟情绪(图5的步骤108A、步骤108B);以及输出控制部(100),根据车辆的虚拟情绪,确定使输出部(15)、(17)输出的信息的内容及输出方式中的一者或两者(图5的步骤112A、步骤112B)。情绪确定部(100)在满足如下条件,即,行驶状态检测部(11)、所检测到的车辆的行驶状态为规定的行驶状态的期间已持续规定期间以上时(图5的步骤106,是),将规定的情绪确定为所述车辆的虚拟情绪(图5的步骤108A)。
-
公开(公告)号:CN108986501A
公开(公告)日:2018-12-11
申请号:CN201810476721.8
申请日:2018-05-18
Applicant: 丰田自动车株式会社
IPC: G08G1/0962 , G08G1/16
CPC classification number: G10L13/043 , G06T13/80 , G08G1/0962
Abstract: 本公开涉及信息提供装置以及信息提供方法。一种信息提供装置,使用多个角色作为接口,向用户提供与车辆的驾驶状况相关的信息,具有:收集单元,根据搭载于所述车辆的一个以上的感测单元所获取的信息,确定要提供给所述用户的信息;发声生成单元,根据所确定的所述信息,生成所述角色各自进行的发声的内容;和输出单元,使各所述角色相互发声,从而对所述用户提供信息。
-
公开(公告)号:CN108885843A
公开(公告)日:2018-11-23
申请号:CN201780019622.0
申请日:2017-02-13
Applicant: 肖恩·劳伦斯
Inventor: 肖恩·劳伦斯
CPC classification number: G09B19/06 , G10L13/043
Abstract: 提供了一种语言学习界面,其被配置为用于通过句子和故事在上下文中逐步引入新单词来进行语言学习。语言学习界面允许学习者的大脑创建记忆钩和思维导图,从而以与大脑被硬连线以这么做的方式相一致的方式学习新语言。界面被配置为显示:第一目标语言句子;与所述第一目标语言句子相关联的第一至少一个母语翻译;以及用于所述至少一个母语翻译的至少一个母语翻译显示切换控件;所述语言学习界面被配置为从用于所述至少一个母语翻译的所述至少一个母语翻译显示切换控件接收母语翻译显示切换指令;以及所述语言学习界面被配置为显示:第二目标语言句子;以及与所述第二目标语言句子相关联的第二至少一个母语翻译,并且其中所述第二至少一个母语翻译不包括所述第一至少一个母语翻译。
-
公开(公告)号:CN107729983A
公开(公告)日:2018-02-23
申请号:CN201710864269.8
申请日:2017-09-21
Applicant: 北京深度奇点科技有限公司
Inventor: 方勇
IPC: G06N3/00 , A63F13/822 , G06K9/00 , G10L13/04
CPC classification number: G06N3/008 , A63F13/822 , G06K9/00355 , G06K9/00664 , G10L13/043
Abstract: 本发明实施例公开了一种利用机器视觉实现人机对弈的方法、装置及电子设备,涉及人工智能技术领域。本发明实施例的利用机器视觉实现人机对弈的方法包括:获取针对对弈机器人的角色设置信息;根据预设模型对所述角色设置信息进行解析,形成解析结果;基于所述解析结果,从语言信息、语音信息、棋力信息、棋风信息以及肢体语言信息中选择加载与所述属性信息匹配的第一执行信息;以及基于所述第一执行信息,所述对弈机器人利用机器视觉完成对弈机器人与交互对象之间的信息交互。通过本发明实施例的方案,能够使对弈机器人具有多个不同的角色,丰富了对弈机器人的交互功能。
-
公开(公告)号:CN107509106A
公开(公告)日:2017-12-22
申请号:CN201710700369.7
申请日:2017-08-16
Applicant: 腾讯音乐娱乐(深圳)有限公司
IPC: H04N21/439 , H04N21/4363 , H04N21/643 , H04M1/725 , H04L29/06 , G10L13/04
CPC classification number: H04N21/439 , G10L13/043 , H04L65/608 , H04M1/72527 , H04M1/7253 , H04N21/43637 , H04N21/643
Abstract: 本公开是关于一种播放音频的方法、装置和系统,属于互联网技术领域。所述方法包括:向第二终端通过传输控制协议TCP通道发送用户数据报协议UDP通道建立通知,建立与第二终端的UDP通道;通过TCP通道接收第二终端返回的数据包参数;通过音频采集设备采集环境中的人声音频;通过UDP通道,基于实时流传输RTSP协议,并根据数据包参数向第二终端发送采集的人声音频,以使得第二终端将人声音频与第二终端中的预存储的目标歌曲的伴奏音频进行合成,得到合成音频,并播放合成音频。用户可以通过本实施例提供的方法,轻松利用家庭中的设备,就可以得到在KTV唱歌的效果,提高了用户体验。
-
-
-
-
-
-
-
-
-