-
公开(公告)号:CN114170643A
公开(公告)日:2022-03-11
申请号:CN202010948016.0
申请日:2020-09-10
Applicant: 富士通株式会社
Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:信息获取单元,其将输入的图像划分为多个区域,并且获取关于多个区域中的面部动作单元的信息;动作单元特征提取单元,其基于所获取的关于面部动作单元的信息来对面部动作单元的区域提取动作单元特征;全局面部特征提取单元,其基于所获取的关于面部动作单元的信息提取全局面部特征;以及分类单元,其基于动作单元特征和全局面部特征两者来对面部动作单元进行分类。该图像处理装置可以通过检测与面部的每个局部区域相对应的面部动作单元的出现来识别微表情。
-
公开(公告)号:CN113674757A
公开(公告)日:2021-11-19
申请号:CN202010402648.7
申请日:2020-05-13
Applicant: 富士通株式会社
Abstract: 本申请公开一种信息处理装置和信息处理方法。该信息处理装置包括:基础特征提取单元,被配置成提取声音的基础特征;多尺度特征提取单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征,提取所述声音的多尺度特征;初级分类单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征对所述声音进行初级分类,以获得初级分类结果;次级分类单元,被配置成基于所述声音的所述初级分类结果和所述多尺度特征对所述声音进行次级分类,以获得次级分类结果;以及分类结果融合单元,被配置成对所述声音的初级分类结果和次级分类结果进行融合,以获得所述声音的最终分类结果。
-
公开(公告)号:CN113392967A
公开(公告)日:2021-09-14
申请号:CN202010165937.X
申请日:2020-03-11
Applicant: 富士通株式会社
Abstract: 公开了领域对抗神经网络的训练方法。该领域对抗神经网络包括:特征提取单元,其针对已标注的源数据提取第一特征,并且针对未标注的目标数据提取第二特征;标签预测单元,其基于第一特征来预测源数据的标签,并且基于第二特征来预测目标数据的标签;判别单元,其基于第一特征和第二特征来判别输入的数据是源数据还是目标数据。该训练方法包括:基于标签预测单元的输出来构建第一损失函数,其中,该第一损失函数是与源数据有关的预测损失;通过利用源数据和目标数据之间的联合概率密度比对第一损失函数加权而获得第二损失函数;利用第一损失函数和第二损失函数来训练标签预测单元和特征提取单元。
-
公开(公告)号:CN108630207B
公开(公告)日:2021-08-31
申请号:CN201710179026.0
申请日:2017-03-23
Applicant: 富士通株式会社
Abstract: 本发明公开了一种说话人确认方法和说话人确认设备。该说话人确认方法用于验证是否由特定说话人进行特定发言,该方法包括:从输入语音中提取与任何文本内容无关的说话人特征,并将所提取的说话人特征与所存储的特定说话人特征进行比较,以确定是否是特定说话人在说话;基于输入语音帧序列的频域特征,从输入语音帧序列中提取分别与彼此不同文本内容对应的多个模板构成的模板串;以及将所得到的模板串与所存储的特定说话人的特定内容模板串进行比较,以确定是否进行了特定发言。
-
公开(公告)号:CN112464965A
公开(公告)日:2021-03-09
申请号:CN201910842132.1
申请日:2019-09-06
Applicant: 富士通株式会社
Abstract: 本公开涉及估计模型的准确性和鲁棒性的方法及其装置。根据本公开内容的一个实施例,该方法包括以下步骤:计算表征第一数据集中的样本在第二数据集中出现的可能性的参数;计算模型的针对第一数据集中的样本的准确性得分;以参数为权重基于准确性得分计算模型的针对第一数据集中样本的加权准确性得分;以及根据加权准确性得分计算模型的针对第一数据集的经调整的准确性作为模型的针对第二数据集的估计准确性。本公开内容的方法、装置至少能有助于实现如下效果之一:方便、准确、有效地估计模型的准确性和鲁棒性。
-
公开(公告)号:CN111914862A
公开(公告)日:2020-11-10
申请号:CN201910384143.X
申请日:2019-05-09
Applicant: 富士通株式会社
IPC: G06K9/62
Abstract: 公开了用于基于目标空间内的目标对多目标模型进行训练的训练装置和训练方法。训练装置包括:目标空间设置单元,对所述目标空间进行设置,以获取具有不同难度级别的多个子目标空间;目标空间改变单元,将待处理的子目标空间从当前的子目标空间改变为具有更高难度级别的下一子目标空间;采样单元,选取目标作为采样目标,以及通过执行动作来获取与采样目标有关的迁移;训练单元,基于迁移对多目标模型进行训练;以及评估单元,通过计算实现当前的子目标空间内的目标的成功率来对多目标模型进行评估。其中,目标空间改变单元被配置成在成功率大于预定阈值的情况下,将待处理的子目标空间从当前的子目标空间改变到具有更高难度级别的下一子目标空间。
-
公开(公告)号:CN111554316A
公开(公告)日:2020-08-18
申请号:CN201910066430.6
申请日:2019-01-24
Applicant: 富士通株式会社
IPC: G10L21/0272 , G10L15/06 , G10L25/51 , G10L25/60
Abstract: 公开了一种语音处理装置,包括:生成器,其被配置成将包括两个或更多个原始单一语音的混合语音分离成两个或更多个分离的单一语音;以及判别器,其被配置成区分所述分离的单一语音是否是所述原始单一语音,其中,对所述生成器和所述判别器进行训练,直到所述判别器不再能够区分所述分离的单一语音是否是所述原始单一语音。根据本公开的装置不仅旨在最大化信号与失真比来获得更好的语音质量,其还将语音分离和提高语音质量集成到单个模型中。此外,根据本公开的装置通过这个过程执行生成性对抗训练,这使得分离的语音与真实的语音难以区分。
-
公开(公告)号:CN111524536A
公开(公告)日:2020-08-11
申请号:CN201910104232.4
申请日:2019-02-01
Applicant: 富士通株式会社
Abstract: 本公开提供了信号处理方法和信息处理设备。信息处理设备包括处理器,所述处理器被配置为:对根据声音信号获得的时频域信号按照频率方向上的多个子带进行划分,以获得与各个子带对应的子带信号;将所获得的子带信号输入到预先训练好的分类模型中;以及利用分类模型确定声音信号中所包括的声音事件的类别,其中,分类模型包括分别与各个子带相对应的多个子带模型,每个子带模型根据通过训练获得的、相对应的子带对声音事件分类的影响而对所输入的子带信号施加权重,并根据被施加权重后的子带信号输出关于声音事件的初步分类结果,以及其中,分类模型根据多个子带模型的初步分类结果输出关于声音事件的最终分类结果。
-
公开(公告)号:CN110349585A
公开(公告)日:2019-10-18
申请号:CN201810301678.1
申请日:2018-04-04
Applicant: 富士通株式会社
Abstract: 提供了语音认证方法和信息处理设备。信息处理设备包括处理器,处理器被配置为:从预定元素集中随机选择至少一个元素;得到被测用户对所选元素的语音输入;将被测用户对每个所选元素的语音输入输入到预训练的神经网络模型,并提取该神经网络模型的一个层的输出数据,作为能够表征被测用户身份以及该元素的综合特征;将所获得的被测用户的关于每个所选元素的综合特征与基于特定用户对该元素的语音输入利用预训练的神经网络模型获得的综合特征进行比较,以至少部分地基于综合特征比较的结果判断被测用户是否为特定用户,其中,预训练的神经网络模型是利用训练语音数据通过以识别说话人身份和预定元素集中的元素作为联合任务进行训练而获得的。
-
公开(公告)号:CN111524536B
公开(公告)日:2023-09-08
申请号:CN201910104232.4
申请日:2019-02-01
Applicant: 富士通株式会社
Abstract: 本公开提供了信号处理方法和信息处理设备。信息处理设备包括处理器,所述处理器被配置为:对根据声音信号获得的时频域信号按照频率方向上的多个子带进行划分,以获得与各个子带对应的子带信号;将所获得的子带信号输入到预先训练好的分类模型中;以及利用分类模型确定声音信号中所包括的声音事件的类别,其中,分类模型包括分别与各个子带相对应的多个子带模型,每个子带模型根据通过训练获得的、相对应的子带对声音事件分类的影响而对所输入的子带信号施加权重,并根据被施加权重后的子带信号输出关于声音事件的初步分类结果,以及其中,分类模型根据多个子带模型的初步分类结果输出关于声音事件的最终分类结果。
-
-
-
-
-
-
-
-
-