一种问题分类方法及系统

    公开(公告)号:CN105045924A

    公开(公告)日:2015-11-11

    申请号:CN201510531001.3

    申请日:2015-08-26

    CPC classification number: G06F16/353

    Abstract: 本发明公开了一种问题分类方法及系统,包括:获取第一预设量的第一训练文本和第二预设量的第二训练文本,第一训练文本已提供问题类型,第二训练文本未提供问题类型;利用第一训练文本及每个第一训练文本的问题类型通过标签传播算法确定每个第二训练文本的问题类型;确定第一训练文本和第二训练文本为训练文本,将训练文本进行分词处理,得到分别与每个训练文本对应的训练词组;利用与每个训练文本对应的训练词组及每个训练文本的问题类型训练最大熵分类器;利用最大熵分类器对待测词组进行分类,得到与待测词组对应的待测文本的问题类型。由此,不需确定大量训练文本的问题类型,无需耗费大量人力,且对待测词组进行分类得到的结果准确率较高。

    一种情感与非情感问题的分类方法及系统

    公开(公告)号:CN105205044A

    公开(公告)日:2015-12-30

    申请号:CN201510531003.2

    申请日:2015-08-26

    Abstract: 本发明公开了一种情感与非情感问题的分类方法及系统,该方法包括:抓取作为训练样本的问题语料;参考预设的情感类问题分类规则,对作为训练样本的问题语料进行类别标签标注;利用标注后的作为训练样本的问题语料,构建情感问题分类器;向构建得到的情感问题分类器输入作为测试样本的问题语料,并利用情感问题分类器输出的类别标签,确认作为测试样本的问题语料的情感类别。以上技术方案能够对自动问答系统中问题语料的情感与非情感问题进行分类,达到了自动问答系统能够更好、更准确地对问题进行回答的目的。

    一种问题分类方法及装置

    公开(公告)号:CN105183808A

    公开(公告)日:2015-12-23

    申请号:CN201510530887.X

    申请日:2015-08-26

    CPC classification number: G06F16/3329 G06K9/6278

    Abstract: 本发明公开了一种问题分类方法及装置,该方法包括:将待分类问题输入至预先建立的分类器中,所述分类器为对多组已知类别的训练样本集进行训练得到的,包括主观类别、客观类别分别在所述训练样本集中出现的概率以及每个特征属性对主观类别、客观类别的条件概率;通过所述分类器分别确定所述待分类问题的每个特征属性对主观类别以及客观类别的条件概率;分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率;将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别。本发明所提供的问题分类方法及装置,能够实现对输入的问题的主客观类别分类,具有较高的分类准确率。

    一种基于特征子空间的新闻分类方法及系统

    公开(公告)号:CN105022845A

    公开(公告)日:2015-11-04

    申请号:CN201510530700.6

    申请日:2015-08-26

    CPC classification number: G06F17/30707

    Abstract: 本发明公开了一种基于特征子空间的新闻分类方法及系统,该方法包括:将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中;利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。当获知待分类新闻的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,从而提高了用户浏览新闻时的体验度。

Patent Agency Ranking