神经网络及其训练方法
    51.
    发明公开

    公开(公告)号:CN113642363A

    公开(公告)日:2021-11-12

    申请号:CN202010392572.4

    申请日:2020-05-11

    Inventor: 王梦蛟 刘汝杰

    Abstract: 公开了神经网络及其训练方法。所述神经网络用于检测呈现攻击,并且被配置为:针对输入的图像提取多个尺寸的特征图;将所述多个尺寸的特征图进行联接,并且基于联接后的特征图生成第一特征;基于所提取的特征图中的最大尺寸的特征图确定多个局部区域;针对所述多个局部区域分别提取特征,并且基于所提取的多个特征生成第二特征;通过将所述第一特征和所述第二特征进行联接而生成分类特征;以及基于所述分类特征来确定所述图像是真实图像还是伪造图像。

    说话人确认方法和说话人确认设备

    公开(公告)号:CN108630207B

    公开(公告)日:2021-08-31

    申请号:CN201710179026.0

    申请日:2017-03-23

    Abstract: 本发明公开了一种说话人确认方法和说话人确认设备。该说话人确认方法用于验证是否由特定说话人进行特定发言,该方法包括:从输入语音中提取与任何文本内容无关的说话人特征,并将所提取的说话人特征与所存储的特定说话人特征进行比较,以确定是否是特定说话人在说话;基于输入语音帧序列的频域特征,从输入语音帧序列中提取分别与彼此不同文本内容对应的多个模板构成的模板串;以及将所得到的模板串与所存储的特定说话人的特定内容模板串进行比较,以确定是否进行了特定发言。

    信息处理装置和方法以及图像识别设备

    公开(公告)号:CN112861590A

    公开(公告)日:2021-05-28

    申请号:CN201911189799.2

    申请日:2019-11-28

    Inventor: 郭松 李斐 刘汝杰

    Abstract: 公开了一种信息处理装置和方法以及图像识别设备。该信息处理装置包括:模板生成单元,被配置成生成针对多个不同面部姿态的多个2D面部关键点模板;模板选择单元,被配置成根据从输入图像检测到的面部图像中的面部姿态和/或关键点的位置,从多个2D面部关键点模板中选择用于所检测到的面部图像的2D面部关键点模板;以及图像剪切单元,被配置成至少根据所检测到的面部图像中的关键点的位置和所选择的2D面部关键点模板,从输入图像剪切出与所检测到的面部图像对应的剪切图像。

    信息处理装置和信息处理方法

    公开(公告)号:CN111723833A

    公开(公告)日:2020-09-29

    申请号:CN201910217426.5

    申请日:2019-03-21

    Inventor: 沈伟 刘汝杰

    Abstract: 公开了一种信息处理装置和信息处理方法。信息处理方法包括以下步骤:将样本图像输入到机器学习架构以获得样本图像的第一特征,使第一分类器基于第一特征计算第一分类损失;基于第一特征和预定的第一掩膜计算第二特征,将第二特征输入到第一分类器以计算熵损失;基于第一掩膜和熵损失来计算第二掩膜以最大化熵损失;基于第一特征和第二掩膜来获得对抗特征,其中,对抗特征是与第二特征互补的特征;以相互关联地训练第一分类器和第二分类器的方式,使第二分类器基于对抗特征来计算样本图像的第二分类损失;以及以使第一分类损失和第二分类损失之和最小的方式来调节机器学习架构、第一分类器以及第二分类器的参数,从而获得经训练的机器学习架构。

    语音处理装置、方法和介质
    55.
    发明公开

    公开(公告)号:CN111554316A

    公开(公告)日:2020-08-18

    申请号:CN201910066430.6

    申请日:2019-01-24

    Abstract: 公开了一种语音处理装置,包括:生成器,其被配置成将包括两个或更多个原始单一语音的混合语音分离成两个或更多个分离的单一语音;以及判别器,其被配置成区分所述分离的单一语音是否是所述原始单一语音,其中,对所述生成器和所述判别器进行训练,直到所述判别器不再能够区分所述分离的单一语音是否是所述原始单一语音。根据本公开的装置不仅旨在最大化信号与失真比来获得更好的语音质量,其还将语音分离和提高语音质量集成到单个模型中。此外,根据本公开的装置通过这个过程执行生成性对抗训练,这使得分离的语音与真实的语音难以区分。

    信号处理方法和信息处理设备

    公开(公告)号:CN111524536A

    公开(公告)日:2020-08-11

    申请号:CN201910104232.4

    申请日:2019-02-01

    Abstract: 本公开提供了信号处理方法和信息处理设备。信息处理设备包括处理器,所述处理器被配置为:对根据声音信号获得的时频域信号按照频率方向上的多个子带进行划分,以获得与各个子带对应的子带信号;将所获得的子带信号输入到预先训练好的分类模型中;以及利用分类模型确定声音信号中所包括的声音事件的类别,其中,分类模型包括分别与各个子带相对应的多个子带模型,每个子带模型根据通过训练获得的、相对应的子带对声音事件分类的影响而对所输入的子带信号施加权重,并根据被施加权重后的子带信号输出关于声音事件的初步分类结果,以及其中,分类模型根据多个子带模型的初步分类结果输出关于声音事件的最终分类结果。

    语音认证方法和信息处理设备

    公开(公告)号:CN110349585A

    公开(公告)日:2019-10-18

    申请号:CN201810301678.1

    申请日:2018-04-04

    Abstract: 提供了语音认证方法和信息处理设备。信息处理设备包括处理器,处理器被配置为:从预定元素集中随机选择至少一个元素;得到被测用户对所选元素的语音输入;将被测用户对每个所选元素的语音输入输入到预训练的神经网络模型,并提取该神经网络模型的一个层的输出数据,作为能够表征被测用户身份以及该元素的综合特征;将所获得的被测用户的关于每个所选元素的综合特征与基于特定用户对该元素的语音输入利用预训练的神经网络模型获得的综合特征进行比较,以至少部分地基于综合特征比较的结果判断被测用户是否为特定用户,其中,预训练的神经网络模型是利用训练语音数据通过以识别说话人身份和预定元素集中的元素作为联合任务进行训练而获得的。

    训练图像模型的方法和装置以及分类预测方法和装置

    公开(公告)号:CN110276362A

    公开(公告)日:2019-09-24

    申请号:CN201810205269.1

    申请日:2018-03-13

    Inventor: 沈伟 刘汝杰

    Abstract: 公开了一种训练图像模型的方法和装置以及分类预测方法和装置。训练图像模型的方法在针对每个样本图像进行的每轮训练中:将通过上一轮训练所得到的对象提取部件对样本图像进行裁剪而得到的图像作为尺度调整后的样本图像输入到图像模型,对象提取部件用于提取各个尺度的样本图像中的关注的对象,初始尺度的样本图像为原始的样本图像;将尺度调整后的样本图像的特征分别输入到图像模型中的局部分类器,针对特征中的特征点进行分类预测,从而得到局部预测结果,并且基于局部预测结果,更新对象提取部件;基于特征和更新后的对象提取部件,对尺度调整后的样本图像进行对象级分类预测;以及基于尺度调整后的样本图像的分类预测结果,训练图像模型。

    三维重建对象的方法和设备

    公开(公告)号:CN106558076B

    公开(公告)日:2019-06-18

    申请号:CN201510590009.7

    申请日:2015-09-16

    Inventor: 李斐 刘汝杰

    Abstract: 本发明公开了一种三维重建对象的方法和设备。该方法包括:获得三维空间中体素的初始局部TSDF值,每个初始局部TSDF值对应于多个深度图中的一个深度图;按对应的深度图,将初始局部TSDF值分组,至少一组初始局部TSDF值对应于不止一个深度图;针对每组初始局部TSDF值,得到该组的全局TSDF值;将所得到的各组的全局TSDF值作为初始局部TSDF值,求解最优化问题,以得到最终全局TSDF值;以及基于所得到的最终全局TSDF值,三维重建所述对象;其中,在所述最优化问题中,变量是体素的全局TSDF值和变换的参数,代价函数与下列因素相关:特定体素的全局TSDF值与该体素经变换对应的体素的初始局部TSDF值的差的平方的加权和,权重等于特定体素经变换对应的体素的对应组的权重。

    数据处理装置和方法
    60.
    发明公开

    公开(公告)号:CN109872379A

    公开(公告)日:2019-06-11

    申请号:CN201711267386.2

    申请日:2017-12-05

    Inventor: 陆萍萍 刘汝杰

    Abstract: 本公开涉及数据处理装置和方法。数据处理装置包括:建模单元,其配置成针对包含遮挡物的图像建立遮挡物模型;渲染单元,其配置成根据所述遮挡物和不包含遮挡物的面部图像之间的几何关系对所述遮挡物模型进行渲染,以使得渲染的遮挡物图像与所述不包含遮挡物的面部图像具有相同的尺度和姿态;以及合成单元,其配置成将不包含遮挡物的面部图像与所述渲染的遮挡物图像合成为遮挡的面部图像。本公开的目的在于提供一种面部数据增强的数据处理装置和方法,其通过生成具有遮挡物的面部数据有效地扩大了有关面部训练数据集的数量,从而提高了有关面部相关模块的性能。

Patent Agency Ranking