一种用于人物关系抽取的方法和装置

    公开(公告)号:CN104657750B

    公开(公告)日:2018-04-27

    申请号:CN201510127450.1

    申请日:2015-03-23

    Abstract: 本发明公开了一种用于人物关系抽取的方法和装置。该方法在获取属于人物实体的页面后,对页面中的人物实体构建人物实体列表。进而,在对文本中的人物实体进行标注时,采用人物实例列表与文本中的人物实体名称进行匹配,完成对人物实体的标注。同时,将已知的用于表征人物实体之间关系的家庭关系三元组映射到文本中,实现对文本中的人物实体之间的人物关系的标注,得到训练语料,并利用训练语料建立分类模型,抽取文中的新的人物实体关系。与现有技术相比,本发明无需人工对人物实体和人物实体之间的人物关系标注时,省时省力,提高了工作效率。

    一种基于CRF模型的情绪原因事件识别方法及系统

    公开(公告)号:CN105045925A

    公开(公告)日:2015-11-11

    申请号:CN201510531026.3

    申请日:2015-08-26

    CPC classification number: G06F16/353

    Abstract: 本发明公开了一种基于CRF模型的情绪原因事件识别方法及系统,包括:获取第一文本,所述第一文本为未提供其情绪原因事件的文本;将所述第一文本进行分词处理,得到第一词组;确定所述第一词组中包括的第一情绪词;获取所述第一词组中每个词语的词性特征和第一距离,所述第一距离为所述第一词组中每个词语与所述第一情绪词之间的距离;利用所述第一词组中的每个词语、每个词语的词性特征及该词语第一距离,通过预先建立的CRF模型,确定所述第一文本的情绪原因事件。实验证明,本发明实施例提供的一种基于CRF模型的情绪原因事件识别方法及系统获取第一文本的情绪原因事件的准确率较高,即对于情绪原因事件的识别性能较好。

    一种情感与非情感问题的分类方法及系统

    公开(公告)号:CN105205044A

    公开(公告)日:2015-12-30

    申请号:CN201510531003.2

    申请日:2015-08-26

    Abstract: 本发明公开了一种情感与非情感问题的分类方法及系统,该方法包括:抓取作为训练样本的问题语料;参考预设的情感类问题分类规则,对作为训练样本的问题语料进行类别标签标注;利用标注后的作为训练样本的问题语料,构建情感问题分类器;向构建得到的情感问题分类器输入作为测试样本的问题语料,并利用情感问题分类器输出的类别标签,确认作为测试样本的问题语料的情感类别。以上技术方案能够对自动问答系统中问题语料的情感与非情感问题进行分类,达到了自动问答系统能够更好、更准确地对问题进行回答的目的。

    一种问题分类方法及装置

    公开(公告)号:CN105183808A

    公开(公告)日:2015-12-23

    申请号:CN201510530887.X

    申请日:2015-08-26

    CPC classification number: G06F16/3329 G06K9/6278

    Abstract: 本发明公开了一种问题分类方法及装置,该方法包括:将待分类问题输入至预先建立的分类器中,所述分类器为对多组已知类别的训练样本集进行训练得到的,包括主观类别、客观类别分别在所述训练样本集中出现的概率以及每个特征属性对主观类别、客观类别的条件概率;通过所述分类器分别确定所述待分类问题的每个特征属性对主观类别以及客观类别的条件概率;分别计算所述待分类问题属于主观类别的第一后验概率以及属于客观类别的第二后验概率;将所述第一后验概率以及第二后验概率中较大值对应的类别作为所述待分类问题所属的类别。本发明所提供的问题分类方法及装置,能够实现对输入的问题的主客观类别分类,具有较高的分类准确率。

    一种评价类型分类方法与系统

    公开(公告)号:CN105159972A

    公开(公告)日:2015-12-16

    申请号:CN201510530886.5

    申请日:2015-08-26

    CPC classification number: G06F16/36 G06F16/35 G06K9/6269

    Abstract: 本发明公开了一种评价类型分类方法与系统,获取目标语料的特征信息,将所述特征信息进行融合;将进行融合后的特征信息转换为支持向量机模型对应格式的可用语料;将所述可用语料按预设规则分为训练语料与测试语料;将所述训练语料进行训练得到预设数量的评价类型的分类模型;分别用每一种所述评价类型的分类模型对所述测试语料中的评价类型进行分类,得到所述测试语料中评价类型的分类结果,使用支持向量机模型,充分地利用上下文信息,建立一个统一的概率模型,可以高效准确地对语料进行评价类型分类。

    一种用于人物关系抽取的方法和装置

    公开(公告)号:CN104657750A

    公开(公告)日:2015-05-27

    申请号:CN201510127450.1

    申请日:2015-03-23

    CPC classification number: G06K9/6217 G06F17/2705 G06F17/2785

    Abstract: 本发明公开了一种用于人物关系抽取的方法和装置。该方法在获取属于人物实体的页面后,对页面中的人物实体构建人物实体列表。进而,在对文本中的人物实体进行标注时,采用人物实例列表与文本中的人物实体名称进行匹配,完成对人物实体的标注。同时,将已知的用于表征人物实体之间关系的家庭关系三元组映射到文本中,实现对文本中的人物实体之间的人物关系的标注,得到训练语料,并利用训练语料建立分类模型,抽取文中的新的人物实体关系。与现有技术相比,本发明无需人工对人物实体和人物实体之间的人物关系标注时,省时省力,提高了工作效率。

    一种基于微博文本和个人信息的用户职业分类方法及系统

    公开(公告)号:CN105243094A

    公开(公告)日:2016-01-13

    申请号:CN201510577403.7

    申请日:2015-09-11

    CPC classification number: G06F16/353

    Abstract: 本发明提供一种基于微博文本和个人信息的用户职业分类方法及系统,所述方法包括以下步骤。收集指定数量第一用户的微博文本和个人信息,并根据第一用户的个人信息获得其职业类型,并将所述第一用户的个人信息作为第一训练样本。根据第一用户的职业类型字段,对第一用户的微博文本和个人信息进行标注,并将标注好的微博文本和个人信息进行分词处理后作为第二训练样本。利用所述第一训练样本及第二训练样本分别构建第一最大熵分类器及第二最大熵分类器,并利用所述第一最大熵分类器及第二最大熵分类器对第二用户进行分类并融合,并根据融合结果确定所述第二用户职业类型。如此,有效提高微博用户职业分类的准确率。

    一种基于特征子空间的新闻分类方法及系统

    公开(公告)号:CN105022845A

    公开(公告)日:2015-11-04

    申请号:CN201510530700.6

    申请日:2015-08-26

    CPC classification number: G06F17/30707

    Abstract: 本发明公开了一种基于特征子空间的新闻分类方法及系统,该方法包括:将已标注样本的整个特征空间划分为若干个不相交的特征子空间,并对若干个不相交的特征子空间中各个特征子空间进行训练,得到与各个特征子空间对应的子分类器;利用训练得到的子分类器对未标注样本进行分类,得到未标注样本的情绪倾向类别,并将已知情绪倾向类别的未标注样本更新至标注样本集中;利用标注样本集构建情绪倾向分类器,并利用构建的情绪倾向分类器对待分类新闻的情绪倾向类别进行分类,得到待分类新闻的情绪倾向类别。当获知待分类新闻的情绪倾向类别后,可以将待分类新闻划分到其含有的情绪倾向类别对应的新闻中,从而提高了用户浏览新闻时的体验度。

    一种基于最大熵模型的评价类型情绪分类方法及系统

    公开(公告)号:CN105005560A

    公开(公告)日:2015-10-28

    申请号:CN201510530734.5

    申请日:2015-08-26

    Abstract: 本发明公开了一种基于最大熵模型的评价类型情绪分类方法及系统,该方法包括:获取原始评价语料,并从原始评价语料中提取特征信息集;将特征信息集中各类特征进行融合,处理得到可用语料;可用语料的语料格式与最大熵模型相匹配;将可用语料划分为训练语料和测试语料,利用训练语料训练最大熵模型,得到情绪分类模型;将测试语料输入情绪分类模型,对测试语料中评价类型的情绪进行分类,得到情绪分类结果。以上本发明提供的技术方案中,使用最大熵模型,能够充分利用了上下文信息,建立一个统一的概率模型,提高了评价类型情绪分类的性能。

    一种情感词与评价对象的关系识别方法

    公开(公告)号:CN103631961A

    公开(公告)日:2014-03-12

    申请号:CN201310693087.0

    申请日:2013-12-17

    CPC classification number: G06F17/30616 G06F17/30705

    Abstract: 一种情感词与评价对象的关系识别方法,其主要步骤为:制作语料、训练条件随机场模型、抽取情感词和评价对象、构成情感词和评价对象候选组、训练最大熵分类器、测试最大熵分类器、实际应用。本发明能充分考虑情感词和评价对象的关系,使用了最大熵分类器并结合了多种特征去识别条件随机场模型抽取出的情感词和评价对象候选组是否有对应关系,获得了良好的识别效果。实验证明本发明提出的一种情感词与评价对象的关系识别方法可以取得较好的效果,适合应用到实际问题中。

Patent Agency Ranking