训练分类模型的装置和方法及利用分类模型分类的装置

    公开(公告)号:CN111582009B

    公开(公告)日:2023-09-15

    申请号:CN201910124176.0

    申请日:2019-02-19

    Inventor: 张梦 刘汝杰

    Abstract: 公开了一种训练分类模型的装置和方法及利用分类模型分类的装置。训练分类模型的装置包括:特征提取单元,被配置成针对第一预定数量的训练集中的每个训练集分别设置特征提取层,并且提取样本图像的特征,至少两个训练集至少部分重叠;特征融合单元,被配置成针对训练集分别设置特征融合层,并且对样本图像的所提取出的特征进行融合;以及损失确定单元,被配置成针对每个训练集分别设置损失确定层,并且基于样本图像的融合后的特征来计算样本图像的损失函数,并基于损失函数来训练分类模型,其中,第一预定数量的训练集共享针对每个训练集分别设置的特征融合层和特征提取层中的至少一个层。

    从视频中识别对象的方法和设备

    公开(公告)号:CN110874547B

    公开(公告)日:2023-09-12

    申请号:CN201811003453.4

    申请日:2018-08-30

    Inventor: 刘汝杰

    Abstract: 本发明公开了一种从视频中识别对象的方法和设备。所述方法包括:将视频分解成一系列图像帧;在包括第一个图像帧的、彼此间隔预定帧数的特定图像帧的全部区域上检测各个对象,并且对所检测到的对象的图像进行质量评估;对于除特定图像帧以外的其余图像帧,基于前一次检测来在其余图像帧的局部区域上检测对象,并且对所检测到的对象的图像进行质量评估;以及对质量大于第一预定阈值的对象的图像进行识别,其中,基于前一次检测来在其余图像帧的局部区域上检测对象包括:以预定比率扩大其余图像帧中的与前一次检测中检测到的对象的区域对应的区域,以得到局部区域;以及在局部区域内检测对象。

    语音认证方法和信息处理设备

    公开(公告)号:CN110349585B

    公开(公告)日:2023-05-05

    申请号:CN201810301678.1

    申请日:2018-04-04

    Abstract: 提供了语音认证方法和信息处理设备。信息处理设备包括处理器,处理器被配置为:从预定元素集中随机选择至少一个元素;得到被测用户对所选元素的语音输入;将被测用户对每个所选元素的语音输入输入到预训练的神经网络模型,并提取该神经网络模型的一个层的输出数据,作为能够表征被测用户身份以及该元素的综合特征;将所获得的被测用户的关于每个所选元素的综合特征与基于特定用户对该元素的语音输入利用预训练的神经网络模型获得的综合特征进行比较,以至少部分地基于综合特征比较的结果判断被测用户是否为特定用户,其中,预训练的神经网络模型是利用训练语音数据通过以识别说话人身份和预定元素集中的元素作为联合任务进行训练而获得的。

    深度估计装置的训练方法、深度估计设备及存储介质

    公开(公告)号:CN109785376B

    公开(公告)日:2023-02-28

    申请号:CN201711128851.4

    申请日:2017-11-15

    Inventor: 李斐 刘汝杰

    Abstract: 本发明公开了一种深度估计装置的训练方法、深度估计设备及存储介质。所述方法包括:向n个所述装置中的每个装置输入n个样本图像,输入至所述装置的n个样本图像的顺序被设置成使得各个装置所接收的第1个样本图像彼此不同,n为大于等于2的整数;利用所述装置所包含的第一神经网络,基于n个样本图像来估计第1个样本图像的深度图和从拍摄其他样本图像的相机的坐标系变换至拍摄第1个样本图像的相机的坐标系的变换矩阵;基于所述变换矩阵来构建使得n个装置相互关联的第一损失函数;以及通过使包括所述第一损失函数的总体损失函数最小化来确定所述装置的参数。

    信息处理装置和信息处理方法
    45.
    发明公开

    公开(公告)号:CN115705745A

    公开(公告)日:2023-02-17

    申请号:CN202110769261.X

    申请日:2021-07-07

    Abstract: 本公开涉及信息处理装置和信息处理方法。根据本公开的信息处理装置用于训练人脸活动单元识别模型。该信息处理装置包括:第一训练单元,被配置成使用第一样本数据进行训练以获得第一识别模型;以及第二训练单元,被配置成对第二样本数据进行上采样处理,并且使用经上采样的第二样本数据对第一识别模型进行进一步训练以获得人脸活动单元识别模型,其中,第一样本数据和第二样本数据中的每个表示人脸活动单元并且包括正标签样本数据和负标签样本数据,以及第一样本数据的出现频率高于第二样本数据的出现频率。根据本公开的信息处理技术,能够在保持高频类人脸活动单元的检测性能的同时,提高低频类人脸活动单元识别的性能。

    用于决定决策的装置、方法和机器可读存储介质

    公开(公告)号:CN114912647A

    公开(公告)日:2022-08-16

    申请号:CN202110177334.6

    申请日:2021-02-07

    Abstract: 本公开涉及一种用于决定决策的装置、方法和机器可读存储介质。该装置包括:获取单元,其获取与决策的决定相关联的M个场景下的M个预测序列以及与每个预测序列分别对应的概率;分配单元,其针对每个场景分别分配N个具体决策方案;第一计算单元,其针对每个场景获得与每个场景对应的组最优决策方案;合并单元,其基于M个场景的组最优决策方案和M个预测序列来获得场景组合决策方案;以及第二计算单元,其基于场景组合决策方案和概率来获得最终决策方案。

    数据处理装置、数据处理方法和计算机可读存储介质

    公开(公告)号:CN114764934A

    公开(公告)日:2022-07-19

    申请号:CN202011636891.1

    申请日:2020-12-31

    Abstract: 本公开内容涉及数据处理装置和数据处理方法。该数据处理装置包括:融合单元,被配置成使用第一样本数据集训练第一分类模型,并且基于第一分类模型对第二样本数据集进行分类的分类结果将第二样本数据集融合到第一样本数据集中以形成第三样本数据集;以及滤除单元和调整单元中的至少之一,其中滤除单元被配置成对第三样本数据集中的属于同一类别的样本数据进行相互比较以滤除相同或相近的样本数据,调整单元被配置成使用第三样本数据集训练第二分类模型,并且基于第二分类模型对第三样本数据集的分类结果对第三样本数据集中的样本数据进行调整。根据该数据处理技术,能够将至少两个样本数据集融合为一个更大的、更干净的和更多样化的样本数据集。

    图像处理装置、图像处理方法和机器可读存储介质

    公开(公告)号:CN114255488A

    公开(公告)日:2022-03-29

    申请号:CN202010947694.5

    申请日:2020-09-10

    Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:信息获取单元,将输入图像划分为多个区域且获取关于多个区域中的面部动作单元的信息;动作单元特征提取单元,基于关于面部动作单元的信息对动作单元的区域提取动作单元特征;第一计算单元,计算每个动作单元的动作单元特征与各个动作单元的动作单元特征的相似度;第二计算单元,基于相似度计算的结果重新计算每个动作单元的动作单元特征;全局面部特征提取单元,基于关于面部动作单元的信息提取全局面部特征;以及分类单元,基于重新计算的动作单元特征和全局面部特征对面部动作单元分类。图像处理装置可以基于动作单元关系学习进行自动微面部表情识别。

    图像处理装置、图像处理方法和机器可读存储介质

    公开(公告)号:CN114170643A

    公开(公告)日:2022-03-11

    申请号:CN202010948016.0

    申请日:2020-09-10

    Abstract: 本公开涉及一种图像处理装置、图像处理方法和机器可读存储介质。图像处理装置包括:信息获取单元,其将输入的图像划分为多个区域,并且获取关于多个区域中的面部动作单元的信息;动作单元特征提取单元,其基于所获取的关于面部动作单元的信息来对面部动作单元的区域提取动作单元特征;全局面部特征提取单元,其基于所获取的关于面部动作单元的信息提取全局面部特征;以及分类单元,其基于动作单元特征和全局面部特征两者来对面部动作单元进行分类。该图像处理装置可以通过检测与面部的每个局部区域相对应的面部动作单元的出现来识别微表情。

    信息处理装置和信息处理方法

    公开(公告)号:CN113674757A

    公开(公告)日:2021-11-19

    申请号:CN202010402648.7

    申请日:2020-05-13

    Abstract: 本申请公开一种信息处理装置和信息处理方法。该信息处理装置包括:基础特征提取单元,被配置成提取声音的基础特征;多尺度特征提取单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征,提取所述声音的多尺度特征;初级分类单元,被配置成基于通过所述基础特征提取单元所提取的所述基础特征对所述声音进行初级分类,以获得初级分类结果;次级分类单元,被配置成基于所述声音的所述初级分类结果和所述多尺度特征对所述声音进行次级分类,以获得次级分类结果;以及分类结果融合单元,被配置成对所述声音的初级分类结果和次级分类结果进行融合,以获得所述声音的最终分类结果。

Patent Agency Ranking