计算句子中的词的概率的方法、装置和神经网络

    公开(公告)号:CN108694163A

    公开(公告)日:2018-10-23

    申请号:CN201710220821.X

    申请日:2017-04-06

    Abstract: 本发明公开了一种计算句子中的词的概率的方法、装置和神经网络。计算句子中的词的概率的方法,包括:依序计算句子中的各个词的长距离依赖特征,特定词的长距离依赖特征表征该特定词与句子中的其他长距离的词之间的依赖关系;依序计算各个词的语义结构特征,特定词的语义结构特征表征包含该特定词及其之前的词的局部句子的语义结构;将每个词的长距离依赖特征和语义结构特征组合,以得到句子中的各个词的词特征;以及基于各个词特征,来计算句子中的各个词的概率。通过本发明的方法,能够将语义结构特征引入到神经网络训练框架中。

    信息处理装置和信息处理方法

    公开(公告)号:CN107766870A

    公开(公告)日:2018-03-06

    申请号:CN201610704157.1

    申请日:2016-08-22

    CPC classification number: G06K9/6256 G06K9/6218 G06K9/6267

    Abstract: 本公开涉及信息处理装置和信息处理方法。根据本公开的信息处理装置包括:划分单元,将具有标签的训练数据的集合划分成第一训练数据集合D1和小于第一训练数据集合D1的第二训练数据集合D2;训练单元,使用第一训练数据集合D1中的训练数据i1按K个类对M个监督模型进行训练;预测单元,使用M个监督模型预测不具有标签的待测数据集合D3中的每个待测数据i3的标签;聚类单元,使用N个聚类模型对第二训练数据集合D2和待测数据集合D3中的数据i进行聚类;相似度图构造单元,基于聚类结果和预测结果构造相似度图;以及融合单元,基于相似度图对待测数据i3的预测的标签和第二训练数据集合D2中的训练数据i2的标签进行融合处理以获得每个待测数据i3的标签。

    对在时间上逐一到达的输入数据进行分类的方法和系统

    公开(公告)号:CN107085572A

    公开(公告)日:2017-08-22

    申请号:CN201610084957.8

    申请日:2016-02-14

    CPC classification number: G06N20/00 G06F16/35 G06F16/285

    Abstract: 本发明提供一种对在时间上逐一到达的输入数据进行分类的方法和系统,包括:a)分别利用在时间上从新到旧数量递增的已获得其真实类别的近期输入数据作为学习样本对预定数量的一组分类器进行训练;b)基于所述一组分类器的近期分类结果,从所述一组分类器中选择对近期输入数据的分类精度最高的分类器;以及c)利用所选择的分类器对当前的输入数据进行分类。本发明提出的方法和系统不需要特意地检测概念漂移,能够自动处理概念漂移,并且能够实现很高的分类精度。

Patent Agency Ranking