-
公开(公告)号:CN111651528A
公开(公告)日:2020-09-11
申请号:CN202010396741.1
申请日:2020-05-11
Applicant: 北京理工大学
IPC: G06F16/28 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明涉及基于生成式对抗网络的开放式实体关系抽取方法,属于自然语言处理与机器学习领域。针对微博数据短小杂乱的特点,以及现有方法未考虑句子间语义相似性导致抽取的实体关系对准确率低且冗余的问题,提出一种基于生成式对抗网络的开放式实体关系抽取方法。该方法首先通过关系词和论元抽取规则得到实体三元组,通过语法分析树筛选三元组得到候选实体关系对。其次利用生成式对抗网络计算句子相似度,根据相似度阈值,划分相似句子组,并结合组内句子包含的实体关系对与其对应的置信度,合并组内实体关系对。本发明在NLP&&CC微博语料上进行实验,结果表明通过计算实体关系对置信度和划分相似句子组,合并组内实体关系对,提高了准确率和召回率,达到了去冗余的效果。
-
公开(公告)号:CN108446275A
公开(公告)日:2018-08-24
申请号:CN201810234144.1
申请日:2018-03-21
Applicant: 北京理工大学
Abstract: 本发明涉及基于注意力双层LSTM的长文本情感倾向性分析方法,属于自然语言处理与机器学习领域。主要为了解决长文本评论篇幅长,正负情感特征离散分布且每个句子的情感语义贡献度不同,导致难以准确判断全文情感倾向的问题。本发明首先利用LSTM学习句子级情感向量表示;然后采用双向LSTM对文档中所有句子的情感语义及句子间的语义关系进行编码,并基于注意力机制对具有不同情感语义贡献度的句子进行权值分配;最后,加权句子级情感向量表示得到长文本的文档级情感向量表示,经过Softmax层得到长文本情感倾向。在Yelp2015和IMDb电影评论语料上实验,结果表明本发明能达到较好的分类效果,进一步提升了情感分类的正确率。
-