估计模型的准确性和鲁棒性的方法及其装置

    公开(公告)号:CN112464965B

    公开(公告)日:2024-06-21

    申请号:CN201910842132.1

    申请日:2019-09-06

    Abstract: 本公开涉及估计模型的准确性和鲁棒性的方法及其装置。根据本公开内容的一个实施例,该方法包括以下步骤:计算表征第一数据集中的样本在第二数据集中出现的可能性的参数;计算模型的针对第一数据集中的样本的准确性得分;以参数为权重基于准确性得分计算模型的针对第一数据集中样本的加权准确性得分;以及根据加权准确性得分计算模型的针对第一数据集的经调整的准确性作为模型的针对第二数据集的估计准确性。本公开内容的方法、装置至少能有助于实现如下效果之一:方便、准确、有效地估计模型的准确性和鲁棒性。

    语音分离方法、语音分离模型训练方法和计算机可读介质

    公开(公告)号:CN111128222B

    公开(公告)日:2023-09-08

    申请号:CN201811276692.7

    申请日:2018-10-30

    Abstract: 本发明涉及一种语音分离方法,包括:使用基于核的至少一个卷积滤波器对语音数据进行第一卷积运算;对经第一卷积运算的数据执行降采样;使用激活函数处理经降采样后的数据;对经激活函数处理后的数据进行第二卷积运算;通过应用至少一个深度神经网络模型识别经第二卷积运算后的数据与讲话人间的对应关系;根据对应关系提取与讲话人对应的数据;使用全连接层处理所提取的数据;对经全连接层处理的数据分别进行第二卷积运算的逆运算和第一卷积运算的逆运算以生成对应于讲话人的语音数据。

    训练元学习网络的装置和方法

    公开(公告)号:CN111652364A

    公开(公告)日:2020-09-11

    申请号:CN201910160129.1

    申请日:2019-03-04

    Inventor: 杨铭 石自强 孙俊

    Abstract: 公开了一种训练元学习网络的装置和方法。训练分类模型的装置包括:获得任务网络实例单元,获得任务神经网络的多个任务网络实例;获得损失单元,获得每个任务网络实例的损失;采样单元,对损失进行采样;计算泛化损失单元,计算反映总体损失的泛化损失;计算梯度单元,计算采样后的多个损失中的每个损失对应的任务网络实例的权重参数的梯度;学习单元,将梯度分别输入到一个元学习网络,获得权重参数的更新量;第一更新单元,基于更新量,更新任务网络实例的权重参数;以及第二更新单元,基于在满足预定条件时的泛化损失,训练元学习网络,其中,基于更新后的元学习网络,迭代地上述单元中的处理,直到满足第一迭代终止条件为止。

    语音认证方法、信息处理设备以及存储介质

    公开(公告)号:CN109872721A

    公开(公告)日:2019-06-11

    申请号:CN201711268086.6

    申请日:2017-12-05

    Abstract: 本公开提供了语音认证方法、信息处理设备以及存储介质。该语音认证方法包括:随机生成由预定素材集中的元素构成的认证序列;提示被测用户以语音方式输入认证序列,得到待认证语音序列;从待认证语音序列中提取语音特征;以及将所提取的语音特征输入到判别模型,以判断被测用户是否为特定注册用户,其中,判别模型基于从注册模型库中选择的、分别与认证序列的各个元素相对应的多个注册语音模型,其中,注册模型库包括分别与预定素材集中的各个元素相对应的注册语音模型,每个元素的注册语音模型是基于从特定用户对该元素的相应语音输入中提取的语音特征而单独预先训练得到的。

    文本背诵质量评估装置和方法

    公开(公告)号:CN106157974A

    公开(公告)日:2016-11-23

    申请号:CN201510161880.5

    申请日:2015-04-07

    Inventor: 石自强 刘汝杰

    Abstract: 本公开涉及文本背诵质量评估装置和方法。所述装置包括:获取单元,用于获取通过背诵文本而产生的文本背诵特征曲线;分割单元,用于对所述文本背诵特征曲线进行分割,以获取所述文本中每个字的字背诵特征曲线;韵律得分获取单元,用于将所述每个字的字背诵特征曲线与每个字的字标准特征曲线进行比较,以获取每个字的韵律得分;声学得分获取单元,用于根据所述每个字的字背诵特征曲线确定所述每个字的背诵准确度,以获取每个字的声学得分;以及评估单元,用于基于每个字的韵律得分和声学得分对所述文本的背诵质量进行评估。由于能够针对每个字的韵律和发声进行打分,从而可以对文本的背诵质量进行评估,使得评估的结果更加精确且符合实际。

    图像处理装置和方法、模型训练装置及存储介质

    公开(公告)号:CN119516296A

    公开(公告)日:2025-02-25

    申请号:CN202311069437.6

    申请日:2023-08-23

    Abstract: 公开了图像处理装置和方法、模型训练装置及计算机可读存储介质。图像处理装置可以包括:图像生成单元,被配置成对输入数据设置多个运动相关参数来使输入数据变化,利用预先训练的扩散生成模型基于变化过程中的输入数据来生成第二图像。多个运动相关参数包括位移、速度和加速度。预先训练的扩散生成模型是通过如下方式得到的:对训练图像集中的每个原始训练图像的各个像素点设置多个运动相关参数来使像素点变化,并且基于在变化过程中的多个阶段的经变化的训练图像来对基于分数的扩散生成模型进行训练,以获得预先训练的扩散生成模型。

    物品识别装置和方法以及电子设备

    公开(公告)号:CN118736540A

    公开(公告)日:2024-10-01

    申请号:CN202310325584.9

    申请日:2023-03-29

    Abstract: 本申请实施例提供一种物品识别装置和方法以及电子设备。所述装置包括:检测器,其对视频数据的图像帧中的参考区域进行物品检测;追踪器,其对多个图像帧中检测到的物品进行追踪;其中以不同时间窗对所述多个图像帧中的所述物品进行多层级判定;以及分类器,其根据所述追踪器的判定结果识别所述物品。由此,即使在某些场景下物品被短暂移动,该物品也不会被识别为两个不同的物品,能够减少物品被重复识别的情况,提升物品检测的准确性和鲁棒性。

    基于稀疏神经网络的语音识别方法、语音识别装置和电子设备

    公开(公告)号:CN107808664B

    公开(公告)日:2021-07-30

    申请号:CN201610773161.3

    申请日:2016-08-30

    Abstract: 本申请实施例提供一种基于稀疏神经网络的语音识别方法、装置和电子设备,该方法包括:对待识别语音片段进行处理,以获得所述待识别语音片段中的每个语音帧的特征向量;采用稀疏神经网络对所述特征向量进行识别,以获得与所述特征向量对应的状态标签值(state id),其中,所述稀疏神经网络的权重矩阵基于维度变换而得到;以及采用解码模型对所述状态标签值进行解码,以得到所述待识别语音片段对应的文本。根据本实施例,语音识别用的稀疏神经网络的规模被缩小,并且,该稀疏神经网络的训练时间较短,训练结果被改善。

    鲁棒性估计方法、数据处理方法和信息处理设备

    公开(公告)号:CN112464966A

    公开(公告)日:2021-03-09

    申请号:CN201910842524.8

    申请日:2019-09-06

    Abstract: 本公开提供了鲁棒性估计方法、数据处理方法和信息处理设备。鲁棒性估计方法用于估计基于训练数据集通过训练预先获得的分类模型的鲁棒性,并且包括:针对训练数据集中的每个训练样本,确定目标数据集中与该训练样本的样本相似度在预定阈值范围内的目标样本,并计算分类模型对于该训练样本的分类结果与分类模型对于所确定的目标样本的分类结果之间的分类相似度;以及基于训练数据集中各个训练样本的分类结果与目标数据集中相对应的目标样本的分类结果之间的分类相似度,确定分类模型对目标数据集的分类鲁棒性。

    多视角向量处理方法和设备

    公开(公告)号:CN109872725A

    公开(公告)日:2019-06-11

    申请号:CN201711267389.6

    申请日:2017-12-05

    Abstract: 本申请公开了一种多视角向量处理方法和设备。多视角向量x用于表征包含至少两个不可分立的视角的信息的对象。该方法包括:建模步骤,建立该多视角向量的模型,使得其至少包含以下分量:所述多视角向量的总体均值μ;所述多视角向量的每一个视角的分量;以及噪声∈;训练步骤,利用所述多视角向量x的训练数据获得所述总体均值μ、每一个视角的分量的参数和所述噪声∈的参数;以及匹配步骤,利用所述总体均值μ、每一个视角的分量的参数和所述噪声∈的参数,计算两个多视角向量的各个视角分量相同和不同的似然性分量,对所计算的似然性分量进行预处理以获得近似似然性,并且依据所述近似似然性来判断两个多视角向量是否匹配。

Patent Agency Ranking