使用自适应网络来对全景声系数进行变换

    公开(公告)号:CN115335900A

    公开(公告)日:2022-11-11

    申请号:CN202180021458.3

    申请日:2021-03-24

    Abstract: 一种设备包括存储器,其被配置为存储在不同时间段处的未经变换的全景声系数。该设备还包括一个或多个处理器,其被配置为:获得在不同时间段处的未经变换的全景声系数,其中,在不同时间段处的未经变换的全景声系数表示在不同时间段处的声场。一个或多个处理器还被配置为:基于约束来将一个自适应网络应用于在不同时间段处的未经变换的全景声系数,以生成在不同时间段处的经变换的全景声系数,其中,在不同时间段处的经变换的全景声系数表示基于约束而修改的、在不同时间段处的经修改的声场。

    用于自然语言处理的音频分析

    公开(公告)号:CN112074900A

    公开(公告)日:2020-12-11

    申请号:CN201980029699.5

    申请日:2019-05-02

    Abstract: 一种设备包括被配置为存储与自然语言处理库的类别相关联的类别标记的存储器。处理器被配置为:分析输入音频数据以生成文本串并至少对所述文本串执行自然语言处理以生成输出文本串,所述输出文本串包括与第一设备、说话者、位置或其组合相关联的动作。所述处理器被配置为:将所述输入音频数据与所述类别的音频数据进行比较,以确定所述输入音频数据是否与所述类别中的任何一个类别相匹配;并且响应于确定所述输入音频数据不与所述类别中的任何一个类别相匹配:创建新类别标记;将所述新类别标记与所述输出文本串的至少一部分相关联;使用所述新类别标记来更新所述类别;以及生成指示所述新类别标记的通知。

    基于特征的话语码本选择
    25.
    发明公开

    公开(公告)号:CN110114829A

    公开(公告)日:2019-08-09

    申请号:CN201780079428.1

    申请日:2017-11-28

    Inventor: 郭寅一 E·维瑟

    Abstract: 一种设备包含话语处理引擎,所述话语处理引擎经配置以接收对应于话语的数据并且以确定与所述话语相关联的第一特征是与参考特征相差至少阈值量。所述设备进一步包含响应于所述话语处理引擎的选择电路。所述选择电路经配置以基于所述第一特征与所述参考特征相差至少阈值量从多个话语码本之中选择特定话语码本。所述特定话语码本与所述第一特征相关联。此第一特征是基于所述用户的情绪、所述用户的环境和所述用户的估计的年龄或距离麦克风的所述用户的估计的距离的。

    虚拟、增强及混合现实
    26.
    发明公开

    公开(公告)号:CN109416585A

    公开(公告)日:2019-03-01

    申请号:CN201780041372.0

    申请日:2017-05-25

    Abstract: 本发明提供一种用于输出虚拟声音的方法,所述方法包含在一或多个麦克风处检测环境中的音频信号。所述方法还包含在处理器处确定所述音频信号的声源的位置,及基于所述音频信号而估计所述环境的一或多个声学特性。所述方法进一步包含基于所述一或多个声学特性而将虚拟声音插入到所述环境中。所述虚拟声音具有从所述声源的所述位置产生的声音的一或多个音频属性。

    用于生成式变换器模型的幻觉缓解

    公开(公告)号:CN120019379A

    公开(公告)日:2025-05-16

    申请号:CN202380072502.2

    申请日:2023-09-19

    Abstract: 提供了用于自然语言处理的系统和技术。系统基于输入内容(例如,文本和/或语音)生成多个令牌(例如,词或其部分)。该系统搜索该多个令牌以基于概率生成该多个令牌的第一排序。该系统生成该多个令牌的自然语言推理(NLI)得分,以基于对该输入内容的忠实度(例如,这些令牌是否基于该输入内容产生为真的陈述)来生成该多个令牌的第二排序。该系统生成输出文本,该输出文本包括基于该第一排序和该第二排序从该多个令牌中选择的至少一个令牌。

    使用协作网络的噪声抑制
    30.
    发明授权

    公开(公告)号:CN117642815B

    公开(公告)日:2025-03-25

    申请号:CN202280048322.6

    申请日:2022-06-23

    Abstract: 一种设备包括被配置为存储指令的存储器和被配置为执行指令的一个或多个处理器。所述一个或多个处理器被配置为执行所述指令以:接收音频数据,所述音频数据包括与第一麦克风的第一输出相对应的第一音频帧和与第二麦克风的第二输出相对应的第二音频帧。所述一个或多个处理器进一步被配置为执行指令以将音频数据提供给第一噪声抑制网络和第二噪声抑制网络。第一噪声抑制网络被配置为生成第一经噪声抑制音频帧,并且第二噪声抑制网络被配置为生成第二经噪声抑制音频帧。所述一个或多个处理器进一步被配置为执行指令以将经噪声抑制音频帧提供给注意力池化网络。注意力池化网络被配置为生成输出经噪声抑制音频帧。

Patent Agency Ranking