-
公开(公告)号:CN107168945A
公开(公告)日:2017-09-15
申请号:CN201710239843.0
申请日:2017-04-13
Applicant: 广东工业大学
Abstract: 一种融合多特征的双向循环神经网络细粒度意见挖掘方法,通过互联网抓取特定网站的评论数据,并对其进行标注和预处理得到训练样本集,使用Word2Vec或Glove模型算法训练得到评论数据的词向量,并进行词性标注、依存关系标注等处理后向量化,将向量输入双向循环神经网络构建得到双向循环神经网络细粒度意见挖掘模型,本发明通过一个模型的训练同时抽取细粒度意见挖掘中属性词以及进行情感极性判断,从而进一步节约了大量的模型训练时间,提高训练效率,而且,无需专业技术人员对属性词进行人工抽取,从而节约了大量的人工成本,另外,可以通过用多种数据源训练模型,从而可以完成跨领域的细粒度意见分析,从而解决长距离情感要素依赖的问题。
-
公开(公告)号:CN107168945B
公开(公告)日:2020-07-14
申请号:CN201710239843.0
申请日:2017-04-13
Applicant: 广东工业大学
IPC: G06F40/289 , G06F16/35
Abstract: 一种融合多特征的双向循环神经网络细粒度意见挖掘方法,通过互联网抓取特定网站的评论数据,并对其进行标注和预处理得到训练样本集,使用Word2Vec或Glove模型算法训练得到评论数据的词向量,并进行词性标注、依存关系标注等处理后向量化,将向量输入双向循环神经网络构建得到双向循环神经网络细粒度意见挖掘模型,本发明通过一个模型的训练同时抽取细粒度意见挖掘中属性词以及进行情感极性判断,从而进一步节约了大量的模型训练时间,提高训练效率,而且,无需专业技术人员对属性词进行人工抽取,从而节约了大量的人工成本,另外,可以通过用多种数据源训练模型,从而可以完成跨领域的细粒度意见分析,从而解决长距离情感要素依赖的问题。
-
公开(公告)号:CN107066446B
公开(公告)日:2020-04-10
申请号:CN201710239556.X
申请日:2017-04-13
Applicant: 广东工业大学
IPC: G06F40/289 , G06F40/30 , G06F40/205 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种嵌入逻辑规则的循环神经网络文本情感分析方法,通过抓取用于训练的文本语料,进行情感类别标记,然后将情感标记的文本语料分为训练集语料、测试集语料,并对其进行分词处理,以及去停用词处理,然后采用word2vec算法对做分词处理、去掉停用词后的训练集语料和测试集语料进行训练,得到相应的词向量,将训练集语料和测试集语料输入现有的知识库结合概率图模型进行分析处理,通过逻辑循环神经网络结构(Logic‑RNN与Logic‑LSTM),将一阶逻辑规则嵌入到循环神经网络中,本发明一方面可以达到控制循环神经网络的训练方向,更倾向人的直觉,另一方面提高了文本情感分析的精度,该方法也可以用于自然语言处理、机器学习的其他领域。
-
公开(公告)号:CN107066446A
公开(公告)日:2017-08-18
申请号:CN201710239556.X
申请日:2017-04-13
Applicant: 广东工业大学
Abstract: 本发明提供一种嵌入逻辑规则的循环神经网络文本情感分析方法,通过抓取用于训练的文本语料,进行情感类别标记,然后将情感标记的文本语料分为训练集语料、测试集语料,并对其进行分词处理,以及去停用词处理,然后采用word2vec算法对做分词处理、去掉停用词后的训练集语料和测试集语料进行训练,得到相应的词向量,将训练集语料和测试集语料输入现有的知识库结合概率图模型进行分析处理,通过逻辑循环神经网络结构(Logic‑RNN与Logic‑LSTM),将一阶逻辑规则嵌入到循环神经网络中,本发明一方面可以达到控制循环神经网络的训练方向,更倾向人的直觉,另一方面提高了文本情感分析的精度,该方法也可以用于自然语言处理、机器学习的其他领域。
-
-
-