用于转换输入音频信号的音频信号处理系统及方法

    公开(公告)号:CN111954904A

    公开(公告)日:2020-11-17

    申请号:CN201980025148.1

    申请日:2019-03-07

    Abstract: 关于用于转换输入音频信号的音频信号处理系统的系统和方法。处理器通过以下来实现模块的步骤:将输入音频信号输入到频谱图估计器中以提取音频特征序列,并对所述音频特征序列进行处理,以输出估计频谱图集合。使用频谱图细化模块处理所述估计频谱图集合和所述音频特征序列,以输出细化频谱图集合。其中所述频谱图细化模块的所述处理基于迭代重构算法。使用信号细化模块处理一个或多个目标音频信号的细化频谱图集合,以获得目标音频信号估计。输出接口输出优化的目标音频信号估计。其中通过使用存储在存储器中的优化器使误差最小化来优化所述模块。

    用于变换输入信号的方法

    公开(公告)号:CN104737229A

    公开(公告)日:2015-06-24

    申请号:CN201380054925.8

    申请日:2013-10-17

    CPC classification number: G10L21/0232 G10L2021/02163

    Abstract: 形式为特征向量的序列的输入信号通过首先将所述输入信号的模型的参数存储到存储器中被变换为输出信号。使用所述向量和所述参数,推断隐变量的向量的序列。对于每个特征向量xn,存在隐变量hi,n的至少一个向量hn,并且每个隐变量非负。使用所述特征向量、隐变量的所述向量和所述参数来生成所述输出信号。每个特征向量xn依赖于相同n的所述隐变量hi,n中的至少一个。所述隐变量根据公式相关,其中j和l是求和索引。所述参数包括非负权重ci,j,l,并且εl,n是独立的非负随机变量。

    用于对文本进行分类的方法

    公开(公告)号:CN104285224B

    公开(公告)日:2018-11-16

    申请号:CN201380024544.5

    申请日:2013-05-15

    CPC classification number: G06F17/30286

    Abstract: 通过根据文本确定文本特征并将文本特征变换为主题特征来对该文本进行分类。使用判别主题模型针对每一个主题特征来确定分数。该模型包括对主题特征进行操作的分类器,其中,通过变换根据文本特征来确定主题特征,并且变换被优化以最大化相对于不正确的类的分数的正确的类的分数。接着,选择针对文本具有最高分数的类标签。在按层次结构组织类的情况下,判别主题模型适用于根据前面的级别调节的每一个级别的类,并且跨级别组合分数以评估最高得分的类标签。

    用于增强输入的有噪信号的方法和系统

    公开(公告)号:CN105684079A

    公开(公告)日:2016-06-15

    申请号:CN201480058216.1

    申请日:2014-10-08

    Abstract: 一种从输入的有噪信号确定多个序列的隐变量的方法,多个序列的隐变量包括表示清晰语音信号的激励分量的至少一个序列的隐变量、表示清晰语音信号的滤波器分量的至少一个序列的隐变量和表示噪声信号的至少一个序列的隐变量。所述多个序列的隐变量包括被确定为非负基函数的非负线性组合的隐变量。所述确定使用清晰语音信号的模型,该模型包括将激励分量和滤波器分量的隐变量约束为在时间上统计地具有依存性的非负源-滤波器动力学系统(NSFDS)。所述方法使用表示激励分量和滤波器分量的相应隐变量的乘积生成输出信号。

    对文本进行处理以构造文本模型的方法

    公开(公告)号:CN104246763A

    公开(公告)日:2014-12-24

    申请号:CN201380017595.5

    申请日:2013-02-26

    CPC classification number: G06F17/30663 G06F17/2785

    Abstract: 文本被处理以构造文本的模型。文本具有共用词汇。文本被分成文本的集合和子集。共用词汇在两个或更多个集合中的用法不同,并且两个或更多个子集的主题不同。针对文本定义概率模型。该概率模型将文本中的各单词视为具有位置和单词值的标志,并且使用该概率模型中的随机变量的分布来表示在文本中的共用词汇的用法、主题、子主题和针对各标志的单词值,其中该随机变量是离散的。对应于与单词关联的词汇用法、单词值、主题和子主题,针对模型,估计参数。

    语音识别系统
    10.
    发明授权

    公开(公告)号:CN110383377B

    公开(公告)日:2023-10-13

    申请号:CN201880015644.4

    申请日:2018-02-23

    Abstract: 一种语音识别系统包括接收包括语音信号的声信号的多个麦克风;从声信号生成多通道输入的输入接口;存储多通道语音识别网络的一个或多个储存器,其中,多通道语音识别网络包括从多通道输入生成时间‑频率掩模的掩模估计网络;被训练为使用时间‑频率掩模从多通道输入中选择基准通道输入并且基于基准通道输入生成增强语音数据集的波束形成器网络;以及被训练为将增强语音数据集变换为文本的编码器‑解码器网络。系统还包括与一个或多个储存器关联地使用多通道语音识别网络以从多通道输入生成文本的一个或多个处理器;和渲染文本的输出接口。

Patent Agency Ranking