用于使用语音分解减少回声的系统和方法

    公开(公告)号:CN119110973A

    公开(公告)日:2024-12-10

    申请号:CN202380034217.1

    申请日:2023-02-24

    Abstract: 一种方法包括在第一神经网络处对经变换输入语音信号执行第一分解操作以生成该经变换输入语音信号的话音分量。该经变换输入语音信号包括与经频域变换的远端语音分量堆叠的经频域变换的近端语音分量。该方法还包括在第二神经网络处对该经变换输入语音信号执行第二分解操作以生成该经变换输入语音信号的非话音分量。该第一神经网络和该第二神经网络对该经变换输入语音信号执行回声消除。该方法还包括在第三神经网络处合并该话音分量与该非话音分量以生成经变换输出语音信号。

    音频缩放
    2.
    发明授权

    公开(公告)号:CN117242788B

    公开(公告)日:2024-11-12

    申请号:CN202280032954.3

    申请日:2022-05-09

    Abstract: 设备包括一个或多个处理器,其被配置为执行指令,以基于第一音频信号中的第一音频信号确定第一相位,并基于第二音频信号中的第二音频信号确定第二相位。一个或多个处理器还被配置为执行指令,以对第一音频信号和第二音频信号中的所选择的音频信号应用空间滤波,以生成增强音频信号。一个或多个处理器还被配置为执行指令,以生成第一输出信号,所述第一输出信号包括将增强音频信号的幅度与第一相位相结合;以及生成第二输出信号,所述第二输出信号包括将增强音频信号的幅度与第二相位相结合。第一输出信号和第二输出信号对应于音频缩放信号。

    处理来自多个麦克风的音频信号
    3.
    发明公开

    公开(公告)号:CN118020313A

    公开(公告)日:2024-05-10

    申请号:CN202280051056.2

    申请日:2022-07-26

    Abstract: 一种第一设备包括存储器和一个或多个处理器,该存储器被配置为存储指令,该一个或多个处理器被配置为从多个麦克风接收音频信号。该一个或多个处理器被配置为处理该音频信号以生成波达方向信息,该波达方向信息对应于在该音频信号中的一个或多个音频信号中表示的声音的一个或多个来源。该一个或多个处理器还被配置为向第二设备发送数据,该数据基于该波达方向信息和与该波达方向信息相关联的类别或嵌入。

    基于特征的话语码本选择

    公开(公告)号:CN110114829B

    公开(公告)日:2023-11-28

    申请号:CN201780079428.1

    申请日:2017-11-28

    Inventor: 郭寅一 E·维瑟

    Abstract: 一种设备包含话语处理引擎,所述话语处理引擎经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是与参考特征相差至少阈值量。所述设备进一步包含响应于所述话语处理引擎的选择电路。所述选择电路经配置以基于所述第一特征与所述参考特征相差至少阈值量从多个话语码本之中选择特定话语码本。所述特定话语码本与所述第一特征相关联。此第一特征是基于所述用户的情绪、所述用户的环境和所述用户的估计的年龄或距离麦克风的所述用户的估计的距离的。

    用于查看占用者状态和管理建筑物的设备的系统和方法

    公开(公告)号:CN113614686A

    公开(公告)日:2021-11-05

    申请号:CN202080023122.6

    申请日:2020-03-25

    Abstract: 一种用于向可安装到车辆仪表板上的视觉接口提供信息的设备包括存储器,该存储器被配置成存储指示建筑物的可控设备的设备信息和指示建筑物的一个或多个占用者的占用者数据。该设备包括处理器,该处理器被配置成实时接收与该建筑物的一个或多个占用者相关联的状态信息。状态信息包括动态位置信息或动态活动信息中的至少一者。该处理器被配置成生成输出以在视觉接口设备处提供建筑物的至少一部分以及与一个或多个占用者相关联的状态信息的视觉表示。该处理器还被配置成基于用户输入来生成用于调整可控设备中的一个或多个设备的操作的指令。

    基于输入话音特性的源话音修改
    7.
    发明公开

    公开(公告)号:CN119836657A

    公开(公告)日:2025-04-15

    申请号:CN202380064160.X

    申请日:2023-08-28

    Abstract: 一种设备包括一个或多个处理器,该一个或多个处理器被配置为处理输入话音的输入音频频谱以检测与该输入话音相关联的第一特性。该一个或多个处理器还被配置为至少部分地基于该第一特性从多个参考嵌入中选择一个或多个参考嵌入。该一个或多个处理器被进一步配置为使用该一个或多个参考嵌入来处理源话音的表示,以生成输出话音的输出音频频谱。

    用于通信的增强音频
    8.
    发明公开

    公开(公告)号:CN117897970A

    公开(公告)日:2024-04-16

    申请号:CN202280057271.3

    申请日:2022-08-31

    Abstract: 一种设备包括一个或多个处理器,其被配置基于描述两个或更多个音频环境的数据,来确定相互音频环境的几何结构。一个或多个处理器还被配置为基于相互音频环境的几何结构来处理音频数据,以在被设置在两个或更多个音频环境中的第一音频环境中的音频设备处输出。

    基于射频感测的声学配置
    9.
    发明公开

    公开(公告)号:CN117203986A

    公开(公告)日:2023-12-08

    申请号:CN202280030492.1

    申请日:2022-05-02

    Abstract: 所公开的是用于检测音频源和配置声学设备设置的系统和技术。例如,无线设备可以获取与对应于从多个反射体反射的第一发射波形的第一多个接收波形相关联的第一射频(RF)感测数据集合。基于所述第一RF感测数据集合,无线设备可以确定所述多个反射体中的第一反射体的分类。无线设备可以基于至少一个反射体的所述分类来确定至少一个声学设置。

    合成语音生成
    10.
    发明公开
    合成语音生成 审中-实审

    公开(公告)号:CN116711002A

    公开(公告)日:2023-09-05

    申请号:CN202180091481.X

    申请日:2021-12-08

    Abstract: 一种用于语音生成的设备包括被配置为接收指示目标语音特性的一个或多个控制参数的一个或多个处理器。一个或多个处理器还被配置为使用多编码器基于一个或多个控制参数处理语音的输入表示,以生成与表示基于目标语音特性的语音版本的音频信号对应的编码的数据。

Patent Agency Ranking