-
公开(公告)号:CN118020100A
公开(公告)日:2024-05-10
申请号:CN202280063346.9
申请日:2022-07-25
Applicant: 海信视像科技股份有限公司
IPC: G10L15/22
Abstract: 一种语音数据的处理方法及装置,当智能设备的唤醒词被配置为第一词语(S100),并对采集的第一语音数据进行处理时(S101),当第一语音数据中不包括第一词语但包括预设内容时(S102),向用户提示第一词语(S103),从而防止用户因遗忘、或不知道修改后的唤醒词、或错误说出其他设备唤醒词等情况下,无法唤醒智能设备的情况,从而提高了智能设备的智能化程度,提高了应用该方法及装置的智能设备的用户的使用体验。
-
公开(公告)号:CN110675872B
公开(公告)日:2023-09-01
申请号:CN201910922874.5
申请日:2019-09-27
Applicant: 海信视像科技股份有限公司
Abstract: 本申请公开了一种基于多系统显示设备的语音交互方法及多系统显示设备。其中,多系统的显示设备中,用于实现语音交互控制功能的应用被拆分为两个应用,并分别位于不同的操作系统,当需要实现语音交互控制功能时,第一操作系统中的语音应用响应于输入的语音,对该语音进行识别得到界面词参数,并通过第一中间件将界面词参数发送给第二中间件,通过第二中间件发送给第二操作系统中的界面词控制应用;界面词控制应用响应于接收到的界面词参数,根据当前场景得到匹配的第一指令,执行所述第一指令,从而基于不同操作系统间的信息交互和数据传递,实现跨系统的语音交互控制功能。
-
公开(公告)号:CN116229965A
公开(公告)日:2023-06-06
申请号:CN202211739224.5
申请日:2022-12-30
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
IPC: G10L15/22 , G10L15/26 , G06F40/289
Abstract: 本公开涉及一种离线命令识别方法及装置,应用于物联网领域,该方法包括:接收目标语音;基于关键词表,从目标语音中识别出至少一个目标关键词,关键词表中包括多个关键词,多个关键词包括至少一个目标关键词;基于至少一个目标关键词生成目标表达语句;根据泛化关系库,确定目标表达语句对应的目标标准命令,泛化关系库中包括多条对应关系,每条对应关系用于表征表达语句对应的标准命令:执行目标标准命令。如此,使得离线命令识别不再局限于固定的表征命令,能够识别灵活多变的说法。
-
公开(公告)号:CN109922371B
公开(公告)日:2021-07-09
申请号:CN201910180348.6
申请日:2019-03-11
Applicant: 海信视像科技股份有限公司
IPC: H04N21/439 , G10L15/22 , G10L15/14 , G10L15/18
Abstract: 本发明实施例提供一种自然语言处理方法、设备及存储介质,该方法包括:获取目标识别结果,该目标识别结果为通过识别用户语音得到的文本信息,用户语音用于查询用户需求;若确定识别结果不为影视名称,则通过预设纠错方法对识别结果进行纠错,得到纠错结果;若通过检错模型判断纠错结果是正确纠错结果,则通过统计分类将纠错结果分配到相应领域,定位相应业务;或者,若通过检错模型判断目标纠错结果是错误纠错结果,则通过统计分类将目标识别结果分配到相应领域,定位相应业务,其中检错模型是预先训练得到的机器学习二分类模型。在得到纠错结果之后,通过检错模型判断纠错结果的合理性,从而提升语义理解的准确度,改善用户体验。
-
公开(公告)号:CN113038048A
公开(公告)日:2021-06-25
申请号:CN202110231065.7
申请日:2021-03-02
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
Abstract: 本实施例提供一种远场语音唤醒方法和显示设备。显示设备在接收唤醒语音后,确定唤醒值。本申请事先测定显示设备静音状态下的唤醒阈值和播放状态下的唤醒阈值。在需要开启远场语音控制功能时,根据显示设备处于的不同状态,调用对应的唤醒阈值与唤醒值作比对,根据比对结果判断是否开启远场语音控制功能。本申请能够避免更改显示设备的音响音效参数,造成的麦克风采集的本机声音与原始音频不一致,最终影响唤醒效果的情况,从而提升用户使用体验。
-
公开(公告)号:CN114299940A
公开(公告)日:2022-04-08
申请号:CN202110577525.1
申请日:2021-05-26
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
Abstract: 本申请实施例提供了一种显示设备及语音交互方法,显示设备包括显示器,用于呈现用户界面;控制器,与显示器连接,控制器被配置为:获取目标人的用户身份信息,并采集语音实时指令,所述目标人包括发出所述唤醒指令的人或注册用户;在摄像头采集的图像中检测人脸信息;若人脸信息为目标人的人脸信息,对目标人进行人脸追踪和唇动检测,若目标人的人脸发生了唇动,且语音实时指令包括目标人的语音,对语音实时指令进行响应;若目标人的人脸没有发生唇动,或语音实时指令不包括目标人的语音,不对语音实时指令进行响应。本申请解决了语音交互体验不佳的技术问题。
-
公开(公告)号:CN112885354A
公开(公告)日:2021-06-01
申请号:CN202110095891.3
申请日:2021-01-25
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
IPC: G10L15/30 , G10L15/22 , G06F40/30 , G06F16/435
Abstract: 本申请涉及显示设备技术领域,特别地,涉及一种显示设备、服务器及基于语音的显示控制方法。一定程度上可以解决显示设备计算能力低、在用户界面复杂情况下识别多音指令准确率低、不能准确区别界面控制指令与媒体检索指令、导致用户界面显示不准确的问题。所述显示设备包括:麦克风,被配置为用于接收包含关键词的语音指令;第一控制器,被配置为:发送第一语音请求至服务器,其中,第一语音请求包括第一关键词及用户界面信息,第一语音请求用于使服务器根据关键词、用户界面信息执行语义理解意图分析以确定包含控制信令、或推荐媒体文件信息的第二控制指令;接收第二控制指令,并根据其包含的控制信令执行用户界面操作、或显示推荐媒体文件信息。
-
公开(公告)号:CN118591839A
公开(公告)日:2024-09-03
申请号:CN202280085596.2
申请日:2022-12-28
Applicant: 海信视像科技股份有限公司
IPC: G10L15/20 , G10L21/0208
Abstract: 一种终端设备和语音唤醒方法,涉及语音交互技术领域。其中,第一终端设备包括:第一通信模块,用于接收第二终端设备发送的待识别语音信号;第一处理模块,用于响应于待识别语音信号,采集音频参考信号;从待识别语音信号中去除音频参考信号,以得到目标识别信号;第一通信模块还将通知信号发送至第二终端设备。此外,第二终端设备具有唤醒模块、主芯片和主机,基于唤醒词和能量结合实现协同唤醒。
-
公开(公告)号:CN114373462A
公开(公告)日:2022-04-19
申请号:CN202210148501.9
申请日:2022-02-17
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
Abstract: 本申请提供的实施例属于语音交互技术领域,具体提供一种语音交互设备及其控制方法、控制装置,该语音交互设备包括唤醒模块、主芯片以及主机,唤醒模块响应于采集到第一音频信号,控制主芯片进入U‑boot进程;在U‑boot进程中,主芯片首先对语音交互设备的初始化,并获取第二音频信号;响应于第二音频信号达到能量阈值时,提取第二音频信号的音频特征,在响应于音频特征满足预设条件时,再根据第二音频信号控制主机启动。本方案中,由唤醒模块和主芯片协同实现对语音交互模块进行唤醒,其可以保障唤醒性能,从而避免语音交互设备被误唤醒或无法正常唤醒等情况,提升用户的交互体验。
-
公开(公告)号:CN109979450B
公开(公告)日:2021-12-07
申请号:CN201910180025.7
申请日:2019-03-11
Applicant: 海信视像科技股份有限公司
Inventor: 王峰
IPC: G10L15/22 , G10L15/26 , G10L15/30 , G10L15/18 , G06F40/295 , G06F40/30 , G06F16/332
Abstract: 本发明提供一种信息处理方法、装置及电子设备。该方法包括:获取输入智能设备的语音信息,提取语音信息中的关键词;根据关键词在关联信息库中确定目标实体和所述目标实体的关联实体,其中关联关系库包括各实体之间的关联关系;根据目标实体和所述关联实体生成综合问答结果,其中综合问答结果包括关联实体的推广信息。上述方法在生成目标实体对应的问答结果的同时,插入目标实体的关联实体的推广信息,实现人机对话中相关信息和服务的引导功能。
-
-
-
-
-
-
-
-
-