合成语音生成
    1.
    发明公开
    合成语音生成 审中-实审

    公开(公告)号:CN116711002A

    公开(公告)日:2023-09-05

    申请号:CN202180091481.X

    申请日:2021-12-08

    Abstract: 一种用于语音生成的设备包括被配置为接收指示目标语音特性的一个或多个控制参数的一个或多个处理器。一个或多个处理器还被配置为使用多编码器基于一个或多个控制参数处理语音的输入表示,以生成与表示基于目标语音特性的语音版本的音频信号对应的编码的数据。

    基于注视检测的图像处理的系统和方法

    公开(公告)号:CN118749194A

    公开(公告)日:2024-10-08

    申请号:CN202380023535.8

    申请日:2023-02-16

    Abstract: 描述了成像系统和技术。成像系统接收如由第一图像传感器捕获的表示第一用户的至少部分(例如,面部)的图像数据。该成像系统标识如在该图像数据中表示的该第一用户的注视指向第二用户的至少部分(例如,面部)的显示表示。该成像系统标识用户表示的布置结构以供输出。该成像系统基于该注视和该布置结构至少部分地通过修改该图像数据来生成修改后的图像数据以基于该注视和该布置结构将该图像数据中的该第一用户的至少该部分修改为在视觉上指向对应于该第二用户的方向。该成像系统输出根据该布置结构进行布置的该修改后的图像数据。

    用于量化的适配器
    3.
    发明公开

    公开(公告)号:CN119404198A

    公开(公告)日:2025-02-07

    申请号:CN202380047766.2

    申请日:2023-06-08

    Abstract: 一种用于人工神经网络(ANN)中的自适应量化的处理器实现的方法包括接收ANN模型。该ANN模型具有目标激活的多个通道。将量化模块结合在该ANN的第一线性层与该ANN的第二线性层之间以生成适配的ANN。该量化模块基于可学习量化模块参数来缩放该第一线性层的权重和偏置的第一集合并基于该可学习量化模块参数的逆来缩放该第二线性层的权重的第二集合。

    基于上下文的语音增强
    4.
    发明公开

    公开(公告)号:CN117043861A

    公开(公告)日:2023-11-10

    申请号:CN202280022231.5

    申请日:2022-02-04

    Abstract: 一种用于执行语音增强的设备包括一个或多个处理器,所述一个或多个处理器被配置为基于输入信号获得输入频谱数据。所述输入信号表示包括语音的声音。所述一个或多个处理器还被配置为使用多编码器变换器处理输入频谱数据和上下文数据,以生成表示输入信号的语音增强版本的输出频谱数据。

    使用本地设备提供的传感器数据和标签的基于云的处理

    公开(公告)号:CN108780523B

    公开(公告)日:2022-05-03

    申请号:CN201780016867.8

    申请日:2017-02-15

    Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。

    用于基于神经网络的音频处理的放宽实例频率归一化

    公开(公告)号:CN118020102A

    公开(公告)日:2024-05-10

    申请号:CN202280065012.5

    申请日:2022-10-04

    Abstract: 用于训练神经网络以将音频分类到多个类别中的一个类别以及使用此类所训练的神经网络的技术和装置。一种示例方法一般包括接收包括多个音频样本的数据集。通过对该多个音频样本中的每个音频样本进行归一化来生成放宽特征归一化数据集。对神经网络进行训练以基于该放宽特征归一化数据集将音频分类到多个类别中的一个类别,并且部署所训练的神经网络。

    使用本地设备提供的传感器数据和标签的基于云的处理

    公开(公告)号:CN108780523A

    公开(公告)日:2018-11-09

    申请号:CN201780016867.8

    申请日:2017-02-15

    CPC classification number: G06N3/08 G06N3/04 G06N3/0454

    Abstract: 一种训练因设备而异的基于云的音频处理器的方法包括接收从本地设备处的多个传感器获取的传感器数据。该方法还包括接收使用本地配置信息在该本地设备上计算出的空间信息标签。这些空间信息标签与所获取的传感器数据相关联。基于这些空间信息标签和传感器数据来训练第一神经网络的下层。已训练的下层被纳入到用于音频分类的第二较大神经网络中。可以使用第一神经网络的已训练的下层来重新训练第二较大神经网络。

Patent Agency Ranking