-
公开(公告)号:CN113892136A
公开(公告)日:2022-01-04
申请号:CN201980096829.7
申请日:2019-05-28
Applicant: 日本电气株式会社
Abstract: 一种神经网络输入单元(81),其输入其中组合了第一网络和第二网络的神经网络,第一网络具有用于输入属于预定类别的锚信号和包括属于该类别的目标信号的混合信号的层以及用于将指示目标信号存在于混合信号中的时频域的重构掩码来作为估计结果进行输出的层,并且第二网络具有用于输入通过将混合信号应用于重构掩码而提取的目标信号的层和用于输出通过将输入的目标信号分类为预定的类别而获得的结果的层。重构掩码估计单元(82)将锚信号和混合信号应用于第一网络以估计锚信号所属类别的重构掩码。信号分类单元(83)将混合信号应用于估计的重构掩码以提取目标信号,并且将提取的目标信号应用于第二网络以将目标信号分类为所述类别。
-
公开(公告)号:CN113475095A
公开(公告)日:2021-10-01
申请号:CN202080016555.9
申请日:2020-01-07
Applicant: 日本电气株式会社
IPC: H04R1/10 , G10K11/178 , G10K15/00 , G06F21/32
Abstract: 本发明提供了:第一声学信息获取单元,其获取通过利用用户佩戴的可穿戴设备接收从第一声源发出的声波而获得的第一声学信息;第二声学信息获取单元,其获取通过利用可穿戴设备接收从第二声源发出的声波而获得的第二声学信息,第二声源与第一声源不同;以及第三声学信息获取单元,其基于第一声学信息和第二声学信息获取用于用户的生物特征匹配的第三声学信息。
-
公开(公告)号:CN114175150A
公开(公告)日:2022-03-11
申请号:CN201980098948.6
申请日:2019-06-07
Applicant: 日本电气株式会社
Abstract: 本声音处理设备(1)包括:第一分段装置(2_1),用于将预定的第一声音分成多个第一片段声音;第二分段装置(2_2),用于将第二声音分成多个第二片段声音;一次说话者识别装置(3),用于计算指示多个第二片段声音与多个第一片段声音中的每一个之间的相似度的分数;阈值计算装置(4),用于在由一次说话者识别装置(3)计算的分数当中,基于指示多个第一片段声音之间的相似度的分数来计算阈值;说话者聚类装置(5),用于将每个具有相似度高于阈值指示的相似度的多个第二片段声音分类为一个或多个簇;以及二次说话者识别装置(6),用于计算一个或多个簇的每一个与第一声音之间的相似度,并基于计算的结果来确定与第一声音相对应的声音是否被包含在一个或多个簇的任何一个中。
-
公开(公告)号:CN114041184A
公开(公告)日:2022-02-11
申请号:CN201980097898.X
申请日:2019-06-28
Applicant: 日本电气株式会社
Abstract: 一种欺骗检测装置(100),其包括多通道频谱图创建单元(10)和评估单元(40)。多通道频谱图创建单元(10)从语音数据提取不同类型的频谱图并整合不同类型的频谱图以创建多通道频谱图。评估单元(40)通过将创建的多通道频谱图应用于使用被标记的多通道频谱图作为训练数据构建的分类器来评估创建的多通道频谱图,并将其分类为真实的或欺骗的。
-
公开(公告)号:CN113557567A
公开(公告)日:2021-10-26
申请号:CN202080012575.9
申请日:2020-02-05
Applicant: 日本电气株式会社
Abstract: 一种说话者识别系统,其包括被配置成存储指令的非暂时性计算机可读介质。所述说话者识别系统进一步包括处理器,所述处理器连接至非暂时性计算机可读介质。处理器被配置成执行有关从输入语音数据中的多个帧中的每个帧提取声学特征的指令。处理器被配置成基于提取的声学特征而使用第一神经网络(NN)来执行有关计算多个帧中的每个帧的显著性值的指令,其中,第一NN是使用说话者后验的经训练的NN。处理器被配置成执行有关使用多个帧中的每个帧的显著性值来提取说话者特征的指令。
-
公开(公告)号:CN101432801B
公开(公告)日:2012-04-18
申请号:CN200780006299.X
申请日:2007-02-02
Applicant: 日本电气株式会社
Inventor: 越仲孝文
CPC classification number: G10L15/065 , G10L15/06 , G10L15/18 , G10L15/183 , G10L15/22
Abstract: 提供一种语音识别词典制作支持系统,其利用可低成本获得的文本数据,能够有效地制作、更新可降低语音识别错误的语音识别用词典、语言模型。语音识别词典制作支持系统包括识别词典存储部(105)、语言模型存储部(106)和声音模型存储部(107)。虚拟语音识别处理部(102)针对由文本解析部(101)生成的解析完毕文本数据,参照识别词典、语言模型及声音模型,生成虚拟语音识别结果文本数据,并与最初的解析完毕文本数据进行比较。更新处理部(103)能够以降低两文本数据不同之处的方式更新识别词典、语言模型。
-
公开(公告)号:CN101432801A
公开(公告)日:2009-05-13
申请号:CN200780006299.X
申请日:2007-02-02
Applicant: 日本电气株式会社
Inventor: 越仲孝文
CPC classification number: G10L15/065 , G10L15/06 , G10L15/18 , G10L15/183 , G10L15/22
Abstract: 提供一种语音识别词典制作支持系统,其利用可低成本获得的文本数据,能够有效地制作、更新可降低语音识别错误的语音识别用词典、语言模型。语音识别词典制作支持系统包括识别词典存储部(105)、语言模型存储部(106)和声音模型存储部(107)。虚拟语音识别处理部(102)针对由文本解析部(101)生成的解析完毕文本数据,参照识别词典、语言模型及声音模型,生成虚拟语音识别结果文本数据,并与最初的解析完毕文本数据进行比较。更新处理部(103)能够以降低两文本数据不同之处的方式更新识别词典、语言模型。
-
-
-
-
-
-