信号提取系统、信号提取学习方法以及信号提取学习程序

    公开(公告)号:CN113892136A

    公开(公告)日:2022-01-04

    申请号:CN201980096829.7

    申请日:2019-05-28

    Abstract: 一种神经网络输入单元(81),其输入其中组合了第一网络和第二网络的神经网络,第一网络具有用于输入属于预定类别的锚信号和包括属于该类别的目标信号的混合信号的层以及用于将指示目标信号存在于混合信号中的时频域的重构掩码来作为估计结果进行输出的层,并且第二网络具有用于输入通过将混合信号应用于重构掩码而提取的目标信号的层和用于输出通过将输入的目标信号分类为预定的类别而获得的结果的层。重构掩码估计单元(82)将锚信号和混合信号应用于第一网络以估计锚信号所属类别的重构掩码。信号分类单元(83)将混合信号应用于估计的重构掩码以提取目标信号,并且将提取的目标信号应用于第二网络以将目标信号分类为所述类别。

    语音处理设备、语音处理方法和存储程序的非暂时性计算机可读介质

    公开(公告)号:CN114175150A

    公开(公告)日:2022-03-11

    申请号:CN201980098948.6

    申请日:2019-06-07

    Abstract: 本声音处理设备(1)包括:第一分段装置(2_1),用于将预定的第一声音分成多个第一片段声音;第二分段装置(2_2),用于将第二声音分成多个第二片段声音;一次说话者识别装置(3),用于计算指示多个第二片段声音与多个第一片段声音中的每一个之间的相似度的分数;阈值计算装置(4),用于在由一次说话者识别装置(3)计算的分数当中,基于指示多个第一片段声音之间的相似度的分数来计算阈值;说话者聚类装置(5),用于将每个具有相似度高于阈值指示的相似度的多个第二片段声音分类为一个或多个簇;以及二次说话者识别装置(6),用于计算一个或多个簇的每一个与第一声音之间的相似度,并基于计算的结果来确定与第一声音相对应的声音是否被包含在一个或多个簇的任何一个中。

    说话者识别系统及其使用方法
    5.
    发明公开

    公开(公告)号:CN113557567A

    公开(公告)日:2021-10-26

    申请号:CN202080012575.9

    申请日:2020-02-05

    Abstract: 一种说话者识别系统,其包括被配置成存储指令的非暂时性计算机可读介质。所述说话者识别系统进一步包括处理器,所述处理器连接至非暂时性计算机可读介质。处理器被配置成执行有关从输入语音数据中的多个帧中的每个帧提取声学特征的指令。处理器被配置成基于提取的声学特征而使用第一神经网络(NN)来执行有关计算多个帧中的每个帧的显著性值的指令,其中,第一NN是使用说话者后验的经训练的NN。处理器被配置成执行有关使用多个帧中的每个帧的显著性值来提取说话者特征的指令。

    语音识别词典制作支持系统、语音识别词典制作支持方法

    公开(公告)号:CN101432801B

    公开(公告)日:2012-04-18

    申请号:CN200780006299.X

    申请日:2007-02-02

    Inventor: 越仲孝文

    CPC classification number: G10L15/065 G10L15/06 G10L15/18 G10L15/183 G10L15/22

    Abstract: 提供一种语音识别词典制作支持系统,其利用可低成本获得的文本数据,能够有效地制作、更新可降低语音识别错误的语音识别用词典、语言模型。语音识别词典制作支持系统包括识别词典存储部(105)、语言模型存储部(106)和声音模型存储部(107)。虚拟语音识别处理部(102)针对由文本解析部(101)生成的解析完毕文本数据,参照识别词典、语言模型及声音模型,生成虚拟语音识别结果文本数据,并与最初的解析完毕文本数据进行比较。更新处理部(103)能够以降低两文本数据不同之处的方式更新识别词典、语言模型。

Patent Agency Ranking