信息处理方法和装置以及信息检测方法和装置

    公开(公告)号:CN108875758B

    公开(公告)日:2022-01-11

    申请号:CN201710320880.4

    申请日:2017-05-09

    Abstract: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从多个样本图像中的每个样本图像提取具有预定宽度和预定高度的一组特征图,其中,一组特征图中的特征图分别与不同的图像特征相对应;以及基于所提取的一组特征图和为多个样本图像标记的文字描述来训练文字描述模型,文字描述模型用于根据输入图像生成相应文字描述,其中,训练文字描述模型包括基于一组特征图和循环神经网络模型的前一状态向量,计算一组特征图上的关注窗口的中心和大小。根据本公开的实施例,能够产生图像的更合适的文字描述。

    信息处理方法和基于文本生成图像的装置

    公开(公告)号:CN108959322B

    公开(公告)日:2021-09-10

    申请号:CN201710379515.0

    申请日:2017-05-25

    Abstract: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。

    数据样本的特征增强方法和装置及分类器训练方法和装置

    公开(公告)号:CN106294490B

    公开(公告)日:2019-12-24

    申请号:CN201510309500.8

    申请日:2015-06-08

    Abstract: 本发明公开了一种对数据样本进行特征增强的方法和装置以及分类器的训练方法和装置。根据本发明的一个方面,对数据样本进行特征增强的方法包括:针对预设的多个类中的每一类,计算多个数据样本的基准分布;计算所述多个数据样本在特征空间上的特征分布;以及基于所述基准分布和所述特征分布,对属于该类的少数数据样本中的至少一部分数据样本的特征进行修改以增强特征。由此,能够增强不均衡数据集中的少数数据样本的特征,从而使得该不均衡的数据集可用于训练诸如分类器的数据挖掘工具,并取得较好的效果。

    信息处理装置和信息处理方法

    公开(公告)号:CN107480687A

    公开(公告)日:2017-12-15

    申请号:CN201610405971.3

    申请日:2016-06-08

    CPC classification number: G06K9/6256 G06K9/6267

    Abstract: 本公开涉及信息处理装置和信息处理方法。根据本公开的信息处理装置包括:划分单元,将具有标签的训练数据的集合划分成第一训练数据集合D1和小于第一训练数据集合D1的第二训练数据集合D2;训练单元,使用第一训练数据集合D1中的训练数据i1按K个类对M个监督模型进行训练;预测单元,使用M个监督模型预测不具有标签的待测数据集合D3中的每个待测数据i3的标签;聚类单元,使用N个聚类模型对第二训练数据集合D2和待测数据集合D3中的数据i进行聚类;相似度图构造单元,基于聚类结果构造相似度图;以及融合单元,基于相似度图对待测数据i3的预测的标签和第二训练数据集合D2中的训练数据i2的标签进行融合处理以获得每个待测数据i3的标签。

    检测特定动作的方法和设备

    公开(公告)号:CN108960016A

    公开(公告)日:2018-12-07

    申请号:CN201710378870.6

    申请日:2017-05-25

    CPC classification number: G06K9/0053 G06K9/00335 G06K9/00536 G06T7/246

    Abstract: 本发明公开了一种检测特定动作的方法和设备。该方法包括:将所收集的动作数据划分为多个具有预定时间长度的序列;确定每个序列的峰值;对于彼此距离小于预定时间长度的两个相邻峰值,去除所述两个相邻峰值之中较小的一个,直至所有峰值中每两个相邻峰值之间的距离都大于或等于预定时间长度;以及基于剩余峰值,确定代表特定动作的检测数据。

    基于神经网络的语言模型训练方法和装置

    公开(公告)号:CN108694443A

    公开(公告)日:2018-10-23

    申请号:CN201710217479.8

    申请日:2017-04-05

    CPC classification number: G06N3/08

    Abstract: 本发明涉及基于神经网络的语言模型训练方法和装置。该方法包括:针对训练集中的每一个目标词,利用噪声生成网络生成目标词特征和噪声词特征,其中,目标词特征和噪声词特征具有各自对应的类别标签;利用上下文神经网络提取目标词的上下文特征;将目标词特征、噪声词特征以及上下文特征构成训练样本输入二分类器;迭代更新噪声生成网络的参数和上下文神经网络的参数,直到二分类器的预测误差接近预定值时停止更新;以及用训练得到的上下文神经网络作为语言模型。根据本发明的方法和装置可以训练得到一种收敛速度较快同时泛化能力较好的语言模型。

    数据样本的特征增强方法和装置及分类器训练方法和装置

    公开(公告)号:CN106294490A

    公开(公告)日:2017-01-04

    申请号:CN201510309500.8

    申请日:2015-06-08

    Abstract: 本发明公开了一种对数据样本进行特征增强的方法和装置以及分类器的训练方法和装置。根据本发明的一个方面,对数据样本进行特征增强的方法包括:针对预设的多个类中的每一类,计算多个数据样本的基准分布;计算所述多个数据样本在特征空间上的特征分布;以及基于所述基准分布和所述特征分布,对属于该类的少数数据样本中的至少一部分数据样本的特征进行修改以增强特征。由此,能够增强不均衡数据集中的少数数据样本的特征,从而使得该不均衡的数据集可用于训练诸如分类器的数据挖掘工具,并取得较好的效果。

    数据聚类方法、模型融合方法以及装置

    公开(公告)号:CN106294343A

    公开(公告)日:2017-01-04

    申请号:CN201510240407.6

    申请日:2015-05-13

    CPC classification number: G06F16/355

    Abstract: 本发明实施例提供一种数据聚类方法、模型融合方法以及装置。所述数据聚类方法包括:利用训练数据进行训练得到多个分类器模型;根据多个分类器模型预测验证数据的类别并得到预测结果矩阵;根据所述验证数据的特征以及所述预测结果矩阵,对所述验证数据的特征空间进行划分以将所述验证数据聚为多个类。本发明实施例不仅考虑数据自身的特征而且考虑不同模型在数据上的预测性能来对数据进行聚类;由此不仅能达到划分数据特征空间的目的,而且使数据特征空间的划分更适合多个模型的融合,能够提高融合系统的性能。

    对待测数据样本进行分类的方法和装置

    公开(公告)号:CN106156783A

    公开(公告)日:2016-11-23

    申请号:CN201510136857.0

    申请日:2015-03-26

    Abstract: 本发明公开了对待测数据样本进行分类的方法和装置。根据本发明的一个方面,对待测数据样本进行分类的方法包括:计算多个分类器中的每个分类器对所述待测数据样本的胜任值;以及根据每个分类器对所述待测数据样本的胜任值,从所述多个分类器中选取一个或一部分分类器对所述待测数据样本进行分类,其中每个分类器对所述待测数据样本的胜任值是根据已经过调整的、该分类器对所述待测数据样本的邻域空间所包含的验证数据样本的胜任值计算得出的,并且其中所述邻域空间包含类别已知的多个验证数据样本中与所述待测数据样本邻近的一部分验证数据样本。

    计算句子中的词的概率的方法、装置和神经网络

    公开(公告)号:CN108694163B

    公开(公告)日:2021-11-26

    申请号:CN201710220821.X

    申请日:2017-04-06

    Abstract: 本发明公开了一种计算句子中的词的概率的方法、装置和神经网络。计算句子中的词的概率的方法,包括:依序计算句子中的各个词的长距离依赖特征,特定词的长距离依赖特征表征该特定词与句子中的其他长距离的词之间的依赖关系;依序计算各个词的语义结构特征,特定词的语义结构特征表征包含该特定词及其之前的词的局部句子的语义结构;将每个词的长距离依赖特征和语义结构特征组合,以得到句子中的各个词的词特征;以及基于各个词特征,来计算句子中的各个词的概率。通过本发明的方法,能够将语义结构特征引入到神经网络训练框架中。

Patent Agency Ranking