-
公开(公告)号:CN115335903B
公开(公告)日:2025-03-25
申请号:CN202180024648.0
申请日:2021-03-01
Applicant: 高通股份有限公司
Abstract: 一种用于执行目标声音检测的设备包括一个或多个处理器。该一个或多个处理器包括配置成存储音频数据的缓冲器、以及目标声音检测器。该目标声音检测器包括第一级和第二级。第一级包括配置成处理该音频数据的二元目标声音分类器。第一级被配置成响应于检测到目标声音而激活第二级。第二级被配置成响应于检测到该目标声音而从该缓冲器接收该音频数据。
-
公开(公告)号:CN105263085B
公开(公告)日:2019-03-01
申请号:CN201510707317.3
申请日:2012-01-13
Applicant: 高通股份有限公司
Inventor: B·福坦普尔 , A·G·P·舒赫威茨 , E·维斯 , B·莫姆耶尔
IPC: H04R3/00
Abstract: 本申请公开了用移动平台进行的可变波束成形。一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。
-
-
公开(公告)号:CN108780523A
公开(公告)日:2018-11-09
申请号:CN201780016867.8
申请日:2017-02-15
Applicant: 高通股份有限公司
IPC: G06N3/04
CPC classification number: G06N3/08 , G06N3/04 , G06N3/0454
Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。
-
公开(公告)号:CN103329568B
公开(公告)日:2016-08-10
申请号:CN201280005335.1
申请日:2012-01-13
Applicant: 高通股份有限公司
Inventor: B·福坦普尔 , A·G·P·舒赫威茨 , E·维斯 , B·莫姆耶尔
IPC: H04R3/00
CPC classification number: H04R3/005 , H04R2201/40 , H04R2410/01 , H04R2430/25 , H04R2499/11 , H04R2499/15
Abstract: 一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。
-
公开(公告)号:CN105263085A
公开(公告)日:2016-01-20
申请号:CN201510707317.3
申请日:2012-01-13
Applicant: 高通股份有限公司
Inventor: B·福坦普尔 , A·G·P·舒赫威茨 , E·维斯 , B·莫姆耶尔
IPC: H04R3/00
CPC classification number: H04R3/005 , H04R2201/40 , H04R2410/01 , H04R2430/25 , H04R2499/11 , H04R2499/15
Abstract: 本申请公开了用移动平台进行的可变波束成形。一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。
-
公开(公告)号:CN115335903A
公开(公告)日:2022-11-11
申请号:CN202180024648.0
申请日:2021-03-01
Applicant: 高通股份有限公司
Abstract: 一种用于执行目标声音检测的设备包括一个或多个处理器。该一个或多个处理器包括配置成存储音频数据的缓冲器、以及目标声音检测器。该目标声音检测器包括第一级和第二级。第一级包括配置成处理该音频数据的二元目标声音分类器。第一级被配置成响应于检测到目标声音而激活第二级。第二级被配置成响应于检测到该目标声音而从该缓冲器接收该音频数据。
-
公开(公告)号:CN108780523B
公开(公告)日:2022-05-03
申请号:CN201780016867.8
申请日:2017-02-15
Applicant: 高通股份有限公司
IPC: G06N3/04
Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。
-
-
公开(公告)号:CN116547675A
公开(公告)日:2023-08-04
申请号:CN202180077449.6
申请日:2021-11-19
Applicant: 高通股份有限公司
IPC: G06N3/096 , G10L15/16 , G06N3/048 , G06N3/0464
Abstract: 一种方法包括:基于被训练以检测第一组声音类别的第一神经网络来初始化第二神经网络,以及将该第一神经网络的输出和该第二神经网络的输出链接到一个或多个耦合网络。该方法还包括:在训练该第二神经网络和该一个或多个耦合网络之后,基于由该第二神经网络指派的声音类别的准确性和由该第一神经网络指派的声音类别的准确性来确定是否要丢弃该第一神经网络。
-
-
-
-
-
-
-
-
-