用于声音事件分类的迁移学习
    11.
    发明公开

    公开(公告)号:CN116547675A

    公开(公告)日:2023-08-04

    申请号:CN202180077449.6

    申请日:2021-11-19

    Abstract: 一种方法包括:基于被训练以检测第一组声音类别的第一神经网络来初始化第二神经网络,以及将该第一神经网络的输出和该第二神经网络的输出链接到一个或多个耦合网络。该方法还包括:在训练该第二神经网络和该一个或多个耦合网络之后,基于由该第二神经网络指派的声音类别的准确性和由该第一神经网络指派的声音类别的准确性来确定是否要丢弃该第一神经网络。

    自适应声音事件分类
    12.
    发明公开

    公开(公告)号:CN116457879A

    公开(公告)日:2023-07-18

    申请号:CN202180077242.9

    申请日:2021-11-19

    Abstract: 一种设备包括一个或多个处理器,该一个或多个处理器被配置成向声音事件分类模型提供音频数据样本。该一个或多个处理器还被配置成:基于声音事件分类模型的响应于音频数据样本的输出来确定音频数据样本的声音类别是否被声音事件分类模型识别出。该一个或多个处理器被进一步配置成:基于确定声音类别未被识别出,确定声音事件分类模型是否对应于与音频数据样本相关联的音频场景。该一个或多个处理器还被配置成:基于确定声音事件分类模型对应于与音频数据样本相关联的音频场景,存储基于音频数据样本的模型更新数据。

    用移动平台进行的可变波束成形

    公开(公告)号:CN103329568A

    公开(公告)日:2013-09-25

    申请号:CN201280005335.1

    申请日:2012-01-13

    Abstract: 一种移动平台包括话筒阵列并且能够实现波束成形以放大或抑制来自声源的音频信息。通过诸如将移动平台指向声源方向之类的用户输入或者通过触摸屏显示器界面来指示声源。移动平台进一步包括能够检测移动平台的移动的取向传感器。当移动平台关于声源移动时,基于来自取向传感器的数据来调整波束成形,以使得在声源的方向上继续实现波束成形。来自声源的音频信息可被加入到电话或视频电话通话中或者从电话或视频电话通话抑制。来自相机的图像或视频可类似地基于来自取向传感器的数据来控制。

Patent Agency Ranking