-
公开(公告)号:CN112992171A
公开(公告)日:2021-06-18
申请号:CN202110177967.7
申请日:2021-02-09
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
IPC: G10L21/0216 , G10L21/0208 , G10L15/22
Abstract: 本申请涉及显示设备技术领域,特别地,涉及一种显示设备及消除麦克风接收回声的控制方法。一定程度上可以解决外挂芯片、或系统芯片在远场语音交互消除回声计算所占用系统资源过多,导致打断唤醒率、唤醒响应速度降低的问题。显示设备包括:扬声器,包括播放第一音频的主声道以及播放第二音频的第一副声道;麦克风,接收主声道生成的第一回声、第一副声道生成的第二回声;第一控制器,被配置为:响应于播放音频、或视频判定第二音频是否源自第一音频;在源自第一音频时,对第一回声、及第二回声均执行基于第一音频对应回采信号的回声消除;在非源自第一音频时,分别对第一回声、第二回声执行基于各自声道播放音频对应回采信号的回声消除。
-
公开(公告)号:CN119865648A
公开(公告)日:2025-04-22
申请号:CN202411942776.5
申请日:2024-12-26
Applicant: 海信视像科技股份有限公司
IPC: H04N21/422 , G10L15/22 , G10L15/20 , G10L21/0208
Abstract: 本申请涉及一种投影设备及远场语音识别方法。所述投影设备包括第一声音采集器、无线传输模块、控制器、信号处理模块和音频输出装置,音频输出装置被配置为输出媒体声音并向信号处理模块发送媒体声音对应的回采参考数据;信号处理模块被配置为向无线传输模块发送回采参考数据;无线传输模块被配置为将回采参考数据发送至控制器;第一声音采集器被配置为采集第一外部声音数据;控制器被配置为:对回采参考数据和第一外部声音数据进行信号对齐;根据信号对齐后的回采参考数据,对信号对齐后的第一外部声音数据中的媒体声音进行回声消除得到远场语音数据;对远场语音数据进行远场语音识别。采用本投影设备能够提高远场语音识别的准确性。
-
公开(公告)号:CN119865647A
公开(公告)日:2025-04-22
申请号:CN202411907621.8
申请日:2024-12-23
Applicant: 海信视像科技股份有限公司
IPC: H04N21/422 , G10L15/20 , G10L21/0208 , G06N3/08 , G06F18/214 , G10L15/22 , G10L21/0216
Abstract: 本申请涉及一种显示设备、服务器及其音频降噪和模型训练方法,涉及智能语音技术领域。该显示设备中包括WiFi模块,被配置为在不同工作模式下进行网络搜索;麦克风,与WiFi模块设置于同一电路板上,被配置为采集音频数据;至少一个控制器,与麦克风和WiFi模块连接,被配置为:控制麦克风采集第一音频数据;第一音频数据至少包括WiFi模块在当前工作模式下的干扰音频;将WiFi模块在当前工作模式下的音频干扰特征作为目标干扰特征;其中,不同工作模式下的音频干扰特征的特征频率或特征强度不同;根据目标干扰特征的特征频率和特征强度,对第一音频数据进行降噪处理,得到第二音频数据提高了第二音频数据的清晰度。
-
公开(公告)号:CN119484915A
公开(公告)日:2025-02-18
申请号:CN202411358376.X
申请日:2024-09-27
Applicant: 海信视像科技股份有限公司
IPC: H04N21/422 , G10L15/22 , G10L15/18 , G10L15/08
Abstract: 本申请提供一种显示设备和语音标识推荐方法。该方法包括接收用户的语音交互数据;确定语音交互数据的目标关键词;在预构建的语音标识库中查找目标关键词,并确定目标关键词对应的目标主题词;响应于目标主题词在语音标识库中的被查找次数超过目标主题词对应的目标查找阈值,在语音标识库中确定目标主题词对应的目标语音标识;显示目标语音标识。该过程可基于用户的语音交互数据确定其中的主题词,并利用语音标识库向用户展示主题词对应的语音标识,以使用户更换语音助手的虚拟形象,可增加用户使用语音交互的频率,提高用户的语音服务体验。
-
公开(公告)号:CN119316643A
公开(公告)日:2025-01-14
申请号:CN202410915147.7
申请日:2024-07-09
Applicant: 海信视像科技股份有限公司
IPC: H04N21/422 , G10L17/22 , G10L17/24
Abstract: 本申请提供一种显示设备、控制设备及设备唤醒方法,所述方法通过响应控制设备输入的测距指令,向控制设备发送反馈信号,并接收控制设备发送的距离参数,根据距离参数确定音频阵列幅值,以及,根据音频阵列幅值调整声音采集器的配置参数,在显示设备处于待机模式时,获取唤醒音频数据,对唤醒音频数据进行唤醒语音识别,唤醒显示设备。本申请通过控制设备获取用户与显示设备的距离参数,并根据距离参数动态调整声音采集器的音频阵列幅值,提高声音采集器对不同距离位置的收音效果,从而提升语音唤醒显示设备的准确性。
-
公开(公告)号:CN118629399A
公开(公告)日:2024-09-10
申请号:CN202410658728.7
申请日:2024-05-24
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
Abstract: 本申请提供一种显示设备及语音唤醒方法,所述方法可以在显示设备处于一阶待机唤醒模式时,响应于唤醒语音,在内核空间中通过第一唤醒模型对唤醒语音执行唤醒词识别。如果唤醒语音包括唤醒词,控制显示设备由一阶待机唤醒模式切换至二阶待机唤醒模式。在用户空间中对唤醒语音执行降噪处理,以及通过第二唤醒模型对降噪处理后的唤醒语音执行唤醒词识别。如果降噪处理后的唤醒语音包括唤醒词,控制显示设备由二阶待机唤醒模式切换至工作模式。其中,一阶待机唤醒模式下,显示设备加载内核空间,不加载用户空间。二阶待机唤醒模式下,显示设备加载内核空间和用户空间。所述方法结合内核空间和用户空间的启动流程,设置双层校验环节,降低待机功耗。
-
公开(公告)号:CN116229962A
公开(公告)日:2023-06-06
申请号:CN202211611894.9
申请日:2022-12-14
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
Abstract: 本申请提供一种终端设备及语音唤醒方法,所述终端设备包括声音采集器、第一处理器和第二处理器,第一处理器可以响应于用户输入的唤醒语音,对唤醒语音进行特征提取,提取唤醒语音的语音特征值,并向第二处理器发送语音特征值,其中,语音特征值为包含唤醒词的频谱特征,频谱特征由唤醒语音经过语音信号处理得到,第二处理器可以响应于第一处理器发送的语音特征值,对语音特征值进行校验,以及在校验成功时,控制终端设备开启语音交互功能。所述方法可以将在唤醒语音中提取的语音特征值进行缓存,在唤醒词二次校验时,直接传输语音特征值进行二次校验,以降低占用的存储空间,提高唤醒响应速度。
-
公开(公告)号:CN115359788A
公开(公告)日:2022-11-18
申请号:CN202210861441.5
申请日:2022-07-20
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
IPC: G10L15/22 , G10L15/20 , G10L21/0208 , H04N21/422
Abstract: 本公开涉及显示装置和远场语音识别方法,包括:扬声器以及远场语音处理模块;远场语音处理模块包括:声音拾取模块,用于拾取远场声音,远场声音包括用户发出的远场语音和扬声器播放的媒体文件的音频,扬声器至少包括主声道和低音声道,第一音频通过主声道播放,第二音频通过低音声道播放;预处理模块,与扬声器的回采输出端电连接,将主声道播放的第一音频和低音声道播放的第二音频进行混音处理后得到播放音频回采信号;回声处理模块,分别与声音拾取模块和预处理模块连接,以接收拾取的远场声音和所述播放音频回采信号,并用播放音频回采信号对拾取的远场声音进行回声消除,以得到用户发出的远场语音,降低了显示装置算力资源的浪费。
-
公开(公告)号:CN113096681A
公开(公告)日:2021-07-09
申请号:CN202110378801.1
申请日:2021-04-08
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
IPC: G10L21/0208 , G10L21/02 , H04N5/64 , H04N21/439 , G09F9/33 , G09F9/35 , G03B31/00
Abstract: 本实施例提供一种显示设备、多声道回声消除电路及多声道回声消除方法,本实施例的显示设备包括扬声器,扬声器包括主声道和副声道,主声道根据分频后的第一音频播放声音,副声道根据分频后的第二音频播放声音,第一音频为从播放服务处理器获取的原始音频执行第一处理后得到的,第二音频为对第一音频执行第二处理后得到的,第一处理和第二处理为不同的音频处理方式。控制器根据第二音频对应的回采参考信号,对第一回声和第二回声执行回声消除。由于第二音频包括原始音频、第一处理的相关信息以及第二处理的相关信息,因此能够实现完全消除多声道的回声的目的,提升回声消除效果,最终提升语音交互效果,提升用户使用体验。
-
公开(公告)号:CN111540357A
公开(公告)日:2020-08-14
申请号:CN202010315910.4
申请日:2020-04-21
Applicant: 海信视像科技股份有限公司
Inventor: 杨香斌
Abstract: 本申请提供一种语音处理方法、装置、终端、服务器及存储介质。该方法包括:采集待检测音频;在检测到所述待检测音频中存在第一音频时,其中,所述第一音频为由应答语产生的回声的音频,所述应答语用于所述终端响应用户输入的唤醒语,将第二音频上传至服务器;其中,所述第二音频为所述待检测音频中位于所述第一音频的结束点之后的音频,所述第二音频用于所述服务器进行语音端点检测。本申请通过终端检测应答语产生的回声的第一音频,将第一音频的结束点之后的第二音频上传到服务器进行语音端点检测,使得服务器进行语音端点检测的音频中不包含第一音频,从而避免服务器将回声的端点误识别为用户语音的端点的情况,提高语音端点检测的准确度。
-
-
-
-
-
-
-
-
-