用于目标声音检测的方法及装备

    公开(公告)号:CN115335903B

    公开(公告)日:2025-03-25

    申请号:CN202180024648.0

    申请日:2021-03-01

    Abstract: 一种用于执行目标声音检测的设备包括一个或多个处理器。该一个或多个处理器包括配置成存储音频数据的缓冲器、以及目标声音检测器。该目标声音检测器包括第一级和第二级。第一级包括配置成处理该音频数据的二元目标声音分类器。第一级被配置成响应于检测到目标声音而激活第二级。第二级被配置成响应于检测到该目标声音而从该缓冲器接收该音频数据。

    用移动平台进行的可变波束成形

    公开(公告)号:CN105263085B

    公开(公告)日:2019-03-01

    申请号:CN201510707317.3

    申请日:2012-01-13

    Abstract: 本申请公开了用移动平台进行的可变波束成形。一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。

    基于上下文的模型选择
    3.
    发明公开

    公开(公告)号:CN116601703A

    公开(公告)日:2023-08-15

    申请号:CN202180077450.9

    申请日:2021-11-19

    Abstract: 一种设备包括一个或多个处理器,该一个或多个处理器被配置成:从一个或多个传感器设备接收传感器数据。该一个或多个处理器还被配置成:基于该传感器数据来确定该设备的上下文。该一个或多个处理器被进一步配置成:基于该上下文来选择模型。该一个或多个处理器还被配置成:使用该模型来处理输入信号以生成因上下文而异的输出。

    使用本地设备提供的传感器数据和标签的基于云的处理

    公开(公告)号:CN108780523A

    公开(公告)日:2018-11-09

    申请号:CN201780016867.8

    申请日:2017-02-15

    CPC classification number: G06N3/08 G06N3/04 G06N3/0454

    Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。

    用移动平台进行的可变波束成形

    公开(公告)号:CN103329568B

    公开(公告)日:2016-08-10

    申请号:CN201280005335.1

    申请日:2012-01-13

    Abstract: 一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。

    用移动平台进行的可变波束成形

    公开(公告)号:CN105263085A

    公开(公告)日:2016-01-20

    申请号:CN201510707317.3

    申请日:2012-01-13

    Abstract: 本申请公开了用移动平台进行的可变波束成形。一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。

    用于目标声音检测的方法及装备

    公开(公告)号:CN115335903A

    公开(公告)日:2022-11-11

    申请号:CN202180024648.0

    申请日:2021-03-01

    Abstract: 一种用于执行目标声音检测的设备包括一个或多个处理器。该一个或多个处理器包括配置成存储音频数据的缓冲器、以及目标声音检测器。该目标声音检测器包括第一级和第二级。第一级包括配置成处理该音频数据的二元目标声音分类器。第一级被配置成响应于检测到目标声音而激活第二级。第二级被配置成响应于检测到该目标声音而从该缓冲器接收该音频数据。

    使用本地设备提供的传感器数据和标签的基于云的处理

    公开(公告)号:CN108780523B

    公开(公告)日:2022-05-03

    申请号:CN201780016867.8

    申请日:2017-02-15

    Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。

    使用射频(RF)感测来实现语音助理的手势接口

    公开(公告)号:CN117480471A

    公开(公告)日:2024-01-30

    申请号:CN202280041756.3

    申请日:2022-05-05

    Abstract: 在一方面,用户装备经由话筒接收来自用户的发声并使用射频感测来确定该用户在进行发声之时执行了手势。该用户装备确定与该手势相关联的对象并向智能助理设备的应用编程接口(API)传送增强型指挥。该增强型指挥是基于该对象、该手势和该发声来确定的。该增强型指挥使得该智能助理设备执行动作。

    用于声音事件分类的迁移学习
    10.
    发明公开

    公开(公告)号:CN116547675A

    公开(公告)日:2023-08-04

    申请号:CN202180077449.6

    申请日:2021-11-19

    Abstract: 一种方法包括:基于被训练以检测第一组声音类别的第一神经网络来初始化第二神经网络,以及将该第一神经网络的输出和该第二神经网络的输出链接到一个或多个耦合网络。该方法还包括:在训练该第二神经网络和该一个或多个耦合网络之后,基于由该第二神经网络指派的声音类别的准确性和由该第一神经网络指派的声音类别的准确性来确定是否要丢弃该第一神经网络。

Patent Agency Ranking