-
公开(公告)号:CN112867987B
公开(公告)日:2024-05-31
申请号:CN201980068526.4
申请日:2019-10-11
Applicant: 三星电子株式会社
IPC: G06F3/16 , G06F3/0481 , G06F3/04883 , G06F3/04842 , G06N3/08 , G10L15/22
Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。
-
公开(公告)号:CN113841196B
公开(公告)日:2025-01-07
申请号:CN202080037110.9
申请日:2020-05-15
Applicant: 三星电子株式会社
IPC: G10L15/22 , G10L21/02 , G10L21/0216
Abstract: 一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,针对当前帧获取语音信号特性和噪声信号特性;通过基于语音信号特性、噪声信号特性以及在当前帧之前的特定时间段内针对先前帧获取的先前语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。
-
公开(公告)号:CN113454717A
公开(公告)日:2021-09-28
申请号:CN201980077694.X
申请日:2019-11-22
Applicant: 三星电子株式会社
Abstract: 本公开涉及一种用于识别用户语音的电子装置和由电子装置识别用户语音的方法。根据一个实施例,识别用户语音的方法包括步骤:获得被分割成多个帧单元的音频信号;通过将根据预设标度分布的滤波器组应用于以帧单元分割的音频信号的频谱来确定针对每个滤波器组的能量分量;对确定的针对每个滤波器组的能量分量进行平滑;基于针对每个滤波器组的平滑后的能量分量提取音频信号的特征向量;以及通过将提取出的特征向量输入到语音识别模型来识别音频信号中的用户语音。
-
公开(公告)号:CN113841196A
公开(公告)日:2021-12-24
申请号:CN202080037110.9
申请日:2020-05-15
Applicant: 三星电子株式会社
IPC: G10L15/22 , G10L21/02 , G10L21/0216
Abstract: 一种语音识别方法,包括:接收第一多声道音频信号;针对与第一多声道音频信号中包括的声道音频信号对应的频带的至少一个频带,获取语音信号特性或噪声信号特性中的至少一个;通过基于语音信号特性、噪声信号特性以及在获取第一多声道音频信号的特定时间之前获取的且针对先前帧获取的语音信号特性对第一多声道音频信号进行波束形成,从而生成具有经增强语音分量的信号;确定经增强语音分量是否包括唤醒词;以及基于确定出经增强语音分量包括唤醒词:基于具有经增强语音分量的信号启用语音识别操作。
-
公开(公告)号:CN112867987A
公开(公告)日:2021-05-28
申请号:CN201980068526.4
申请日:2019-10-11
Applicant: 三星电子株式会社
IPC: G06F3/16 , G06F3/0481 , G06F3/0488 , G06N3/08 , G10L15/22
Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。
-
公开(公告)号:CN113454717B
公开(公告)日:2025-01-10
申请号:CN201980077694.X
申请日:2019-11-22
Applicant: 三星电子株式会社
Abstract: 本公开涉及一种用于识别用户语音的电子装置和由电子装置识别用户语音的方法。根据一个实施例,识别用户语音的方法包括步骤:获得被分割成多个帧单元的音频信号;通过将根据预设标度分布的滤波器组应用于以帧单元分割的音频信号的频谱来确定针对每个滤波器组的能量分量;对确定的针对每个滤波器组的能量分量进行平滑;基于针对每个滤波器组的平滑后的能量分量提取音频信号的特征向量;以及通过将提取出的特征向量输入到语音识别模型来识别音频信号中的用户语音。
-
公开(公告)号:CN118466889A
公开(公告)日:2024-08-09
申请号:CN202410594655.X
申请日:2019-10-11
Applicant: 三星电子株式会社
IPC: G06F3/16 , G06F3/0481 , G06F3/04842 , G06F3/04883 , G06N3/08 , G06V10/764 , G10L15/22 , G10L15/26
Abstract: 提供了一种能够通过用户界面提供对应于用户语音的文本信息的电子设备以及控制该电子设备的方法。具体地,根据本公开的电子设备,当获得包括至少一个对象的图像时,分析图像以识别包括在图像中的至少一个对象,并且当接收到用户语音时,对用户语音执行语音识别以获得对应于用户语音的文本信息,然后识别包括在图像中的至少一个对象当中的对应于用户语音的对象,并且在显示器上的区域当中的与被识别为对应于用户语音的对象相对应的区域上显示包括文本信息的备忘录用户界面(UI)。
-
-
-
-
-
-