-
公开(公告)号:CN108763326A
公开(公告)日:2018-11-06
申请号:CN201810421744.9
申请日:2018-05-04
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于特征多样化的卷积神经网络的情感分析模型构建方法。该方法首先导入情感词典集合与句子语料训练集,并对初始数据集做相应预处理,通过计算情感词在不同极性数据集上出现的文档频数来计算情感得分以及普通词条的权重得分,得到词条得分特征统计值并构建特征向量。把得到的情感词典情感得分向量以及普通词条权重得分向量与向量化后的训练集句子向量进行拼接或者运算操作,得到具有特征信息多样化的输入矩阵。最后用特定参数的卷积神经网络模型训练数据集,得到训练好的模型。本发明能够解决模型在模型训练过程中对更深层的隐藏情感信息挖掘不够全面的问题,还能够有效提高情感分类的精确度。
-
公开(公告)号:CN108763326B
公开(公告)日:2021-01-12
申请号:CN201810421744.9
申请日:2018-05-04
Applicant: 南京邮电大学
Abstract: 本发明公开一种基于特征多样化的卷积神经网络的情感分析模型构建方法。该方法首先导入情感词典集合与句子语料训练集,并对初始数据集做相应预处理,通过计算情感词在不同极性数据集上出现的文档频数来计算情感得分以及普通词条的权重得分,得到词条得分特征统计值并构建特征向量。把得到的情感词典情感得分向量以及普通词条权重得分向量与向量化后的训练集句子向量进行拼接或者运算操作,得到具有特征信息多样化的输入矩阵。最后用特定参数的卷积神经网络模型训练数据集,得到训练好的模型。本发明能够解决模型在模型训练过程中对更深层的隐藏情感信息挖掘不够全面的问题,还能够有效提高情感分类的精确度。
-
公开(公告)号:CN108710609A
公开(公告)日:2018-10-26
申请号:CN201810428598.2
申请日:2018-05-07
Applicant: 南京邮电大学
CPC classification number: G06F17/2775 , G06K9/6256
Abstract: 本发明公开一种基于多特征融合的社交平台用户信息的分析方法,解决了目前社交网络的用户信息分析主要集中在用户的行为数据,而没有充分挖掘用户在社交网络内发表的文本内容这一问题。本发明首先用社交网络平台上的应用编程接口获取用户行为数据和文本内容数据,然后对行为数据进行处理,剔除缺失的无效用户,对行为数据进行量化,得到用户的行为统计数据,接着对用户发表的文本内容进行分词以及词频统计,对不同的词进行权重调整,最后利用主成分分析简化所得数据,应用线性回归和决策树算法,对用户的性别、年龄、性格成分进行预测。本发明通过结合用户在社交网络平台上的行为数据和发表的文本内容,在性别、年龄、性格成分的预测上拥有很好的准确性。
-
-