一种文本情绪预测方法及装置

    公开(公告)号:CN104573030B

    公开(公告)日:2017-12-12

    申请号:CN201510018521.4

    申请日:2015-01-14

    Abstract: 本申请提供的文本情绪预测方法及装置,构建情绪匹配知识库,将待分类文本与情绪匹配知识库进行匹配,得到待分类文本的情绪特征,将所述待分类文本的情绪特征进行分类,得到文本的情绪分类结果。在人工构建具有动作与对象标注的情绪匹配知识库的基础上,将待分类文本自动学习进行分类,提高读者情绪预测的准确性和效率,满足大规模文本语料处理的需求。

    一种文本情绪预测方法及装置

    公开(公告)号:CN104573030A

    公开(公告)日:2015-04-29

    申请号:CN201510018521.4

    申请日:2015-01-14

    Abstract: 本申请提供的文本情绪预测方法及装置,构建情绪匹配知识库,将待分类文本与情绪匹配知识库进行匹配,得到待分类文本的情绪特征,将所述待分类文本的情绪特征进行分类,得到文本的情绪分类结果。在人工构建具有动作与对象标注的情绪匹配知识库的基础上,将待分类文本自动学习进行分类,提高读者情绪预测的准确性和效率,满足大规模文本语料处理的需求。

    一种面向社交媒体的在线争辩生成方法、系统及存储介质

    公开(公告)号:CN111339310A

    公开(公告)日:2020-06-26

    申请号:CN201911191509.8

    申请日:2019-11-28

    Abstract: 本发明提供了一种面向社交媒体的在线争辩生成方法、系统及存储介质,该在线争辩生成方法包括:步骤1:收集用户在社交媒体上针对热点事件的在线争辩文本数据,对在线争辩文本数据进行人工标注;步骤2:收集与在线争辩文本数据相关的结构化知识与文本知识;步骤3:结合结构化知识与文本知识,利用在线争辩文本数据训练自然语言生成模型;步骤4:在真实争辩文本中,使用自然语言生成模型生成相应的争辩文本,该争辩文本用于改变用户的观点。本发明的有益效果是:本发明结合知识图谱信息,可以充分利用文本信息中的尝试知识,可以生成更流畅、更具有争辩性的文本。

    文本表示方法及系统
    14.
    发明授权

    公开(公告)号:CN106446264B

    公开(公告)日:2019-08-27

    申请号:CN201610907526.7

    申请日:2016-10-18

    Abstract: 本发明公开了一种文本表示方法及系统,所述文本表示方法包括:获取文本中词语的相关属性,利用所述文本中词语的相关属性构建基于主体间性的异质网络,所述相关属性至少包括所述词语的社交属性和评论习惯属性;使用网络节点嵌入的学习算法对所述异质网络中不同属性的节点进行连续低维向量表示,得到词语发布者低维连续向量表示及词语评论对象低维连续向量表示;将所述发布者低维连续向量表示及评论对象的低维连续向量表示,应用于文本分类的具体任务并汇总,得到相应的文本分类模型。本发明综合考虑词语的社交属性以及词语的评论习惯属性,给予了词向量更丰富的语义信息,提高了词向量表示学习的精准性,获得更加准确的文本分类结果。

    迁移学习方法及装置
    15.
    发明授权

    公开(公告)号:CN104616031B

    公开(公告)日:2018-06-12

    申请号:CN201510032970.4

    申请日:2015-01-22

    Abstract: 本发明公开了一种迁移学习方法及装置,方法包括:设置迁移学习的相关参数并初始化;开始迁移学习迭代,获得自动化标注数据;当迭代次数满足迭代周期,对该迭代周期内作为样本的自动化标注数据进行误差检测,确定该迭代周期的样本相对质量;根据样本相对质量确定样本的删除或保留,并确定是否继续迁移学习迭代,当终止迁移学习迭代,输出保留的样本和迁移分类器。本发明的有益效果是:在迁移学习过程中,将学习过程按迁移周期划分,每满一个迁移周期则进行误差检测,根据误差检测确定的样本相对质量筛选样本,由此来剔除低质量样本以达到提高迁移学习中自动标注数据的样本质量的目的,进而提升应用迁移学习方法的系统的准确性。

    类噪音检测方法、装置和损失函数计算方法、装置

    公开(公告)号:CN105653867A

    公开(公告)日:2016-06-08

    申请号:CN201511031545.X

    申请日:2015-12-31

    CPC classification number: G06F19/00 G06K9/6267

    Abstract: 本申请公开了一种类噪音检测方法、装置和损失函数计算方法、装置。所述类噪音检测方法对于训练集之中任一训练样本使用无参数分类方法选择训练集之中与其最相似的若干个样本其中j=1、2、3、…、k,k为正整数;之后利用来计算训练样本的噪音率Pc(xi)。本申请计算训练样本的噪音率过程中不需要任何先验知识,且计算出来的结果不存在传统技术中对于训练样本的类噪音往往过高估计的现象,因而能更加准确的反应出标注的训练样本其标签错误的概率。

    迁移学习方法及装置
    17.
    发明公开

    公开(公告)号:CN104616031A

    公开(公告)日:2015-05-13

    申请号:CN201510032970.4

    申请日:2015-01-22

    CPC classification number: G06K9/6256 G06K9/6262

    Abstract: 本发明公开了一种迁移学习方法及装置,方法包括:设置迁移学习的相关参数并初始化;开始迁移学习迭代,获得自动化标注数据;当迭代次数满足迭代周期,对该迭代周期内作为样本的自动化标注数据进行误差检测,确定该迭代周期的样本相对质量;根据样本相对质量确定样本的删除或保留,并确定是否继续迁移学习迭代,当终止迁移学习迭代,输出保留的样本和迁移分类器。本发明的有益效果是:在迁移学习过程中,将学习过程按迁移周期划分,每满一个迁移周期则进行误差检测,根据误差检测确定的样本相对质量筛选样本,由此来剔除低质量样本以达到提高迁移学习中自动标注数据的样本质量的目的,进而提升应用迁移学习方法的系统的准确性。

Patent Agency Ranking