-
公开(公告)号:CN107169145B
公开(公告)日:2019-11-26
申请号:CN201710465289.8
申请日:2017-06-19
Applicant: 武汉大学
IPC: G06F16/2458 , G06F16/28 , G06K9/62 , G06Q50/06
Abstract: 本发明涉及计算机科学数据挖掘中的聚类和电气工程中的线损标杆值计算等技术领域,具体涉及一种基于聚类算法的用户窃电严重等级检测的方法,1.在电网平台内采集用户用电量异常率、线损率、三相电压/电流、功率因数。2.针对用户计算线损标杆值,比较实际线损率与线损标杆值,对超出值划分区间,得到线损异常等级0~5。3.利用三相电压/电流计算三相电压/电流不平衡率。4.以上述数据为输入样本,采用k‑means聚类算法对其聚类得到6种类别,即窃电严重等级。5.分别计算待检用户数据与6种类别的欧氏距离,距离最近者即为待检用户窃电严重等级。该检测方法利用聚类算法对大量样本进行聚类,可以有效划分出用户窃电严重等级。
-
公开(公告)号:CN109858034A
公开(公告)日:2019-06-07
申请号:CN201910136963.7
申请日:2019-02-25
Applicant: 武汉大学
Abstract: 本发明公开了一种基于注意力模型和情感词典的文本情感分类方法,首先获取需要进行情感分类的目标文本数据集,一部分用作训练集,另一部分作为测试集;并对目标文本数据集进行预处理,生成情感词典;然后基于情感词典,获取对文本数据具有情感表达作用的情感特征;接着获取文本中各词语的词向量,基于词向量和情感特征,计算目标文本的情感特征向量E1;最后基于注意力模型,通过目标文本的情感特征向量获取情感分类结果。本发明通过构建注意力模型,结合情感词典,能进行快速准确的文本情感分类。
-
公开(公告)号:CN109614997A
公开(公告)日:2019-04-12
申请号:CN201811440083.0
申请日:2018-11-29
Applicant: 武汉大学
Abstract: 本发明提供了一种基于深度学习的窃电风险预测方法及装置,针对传统窃电预测方法中存在的由于不了解配电网内部的拓扑结构而导致的不能定位窃电用户问题以及由于传统窃电预测方法中由于使用了非高效识别的特征导致窃电预测准确率低等问题提出了解决方案。预测方法首先利用低压用户日历史用电信息,进行用户日用电模式量的预测;其次,根据用户日近三天用电的用电因素分析,采用层次分析法,计算出用电异常率,最后,基于K-Means方法进行窃电等级划分。实现了提高预测准确性以及实现窃电等级划分的技术效果。
-
公开(公告)号:CN108536781A
公开(公告)日:2018-09-14
申请号:CN201810271740.7
申请日:2018-03-29
Applicant: 武汉大学
Abstract: 本发明属于数据挖掘、舆情分析的研究范畴,涉及一种社交网络情绪焦点的挖掘方法及系统,包括:语料数据预处理、神经网络模型构建及训练、情绪焦点聚类三个步骤。深入挖掘用户在社交网络中展现的情绪的关注焦点,从而为社会舆论引导提供更为明确的决策辅助。本发明可用于舆情监控与干预、谣言检测等网络信息监管领域。
-
公开(公告)号:CN106991617A
公开(公告)日:2017-07-28
申请号:CN201710203903.3
申请日:2017-03-30
Applicant: 武汉大学
IPC: G06Q50/00
Abstract: 本发明涉及一种基于信息传播的微博社交关系提取算法,包括:1.使用平台开放接口或者爬虫软件获得微博数据,以及微博下的评论与转发数据。2.以用户为基本单位检索出其原创微博,对于每一条原创微博,创建微博信息传播树,对树的边赋予权重。3.通过信息传播树,反演化用户社交关系树。4.单用户社交关系融合。5.多用户社交关系融合。通过本发明可以重新获得基于信息传播的微博用户间的社交关系,同时,通过赋予权重等手段,可以对用户间的亲密关系进行量化处理。经过本发明算法的数据处理后,获得的微博用户社交拓扑结构,是对在线社交网络进一步分析应用的重要数据基础。
-
公开(公告)号:CN106991160A
公开(公告)日:2017-07-28
申请号:CN201710203904.8
申请日:2017-03-30
Applicant: 武汉大学
CPC classification number: G06F16/951 , G06Q50/01
Abstract: 本文发明涉及一种基于用户影响力以及内容的微博传播预测方法,流程如下:1.利用scrapy技术对两个用户的个人信息和他们之间的转发关系及转发微博进行爬取。2.利用RankPage影响力分析技术提取用户影响力,形成用户权威预测因子。3.采用单位时间粉丝转发微博在所有发表微博的百分比,提取粉丝转发活跃度预测因子。4.采用TF‑IDF词语权重技术对微博内容进行重要性分析,提取微博重要性预测因子。5.利用滚雪球的抽样方法将提取到的转发关系划分成10折微博转发训练集和微博忽略训练集。6.利用有监督的贝叶斯网络对训练集进行训练,直至分类器参数收敛。利用本发明可以提高针对新浪微博特定粉丝转发微博预测的准确度。
-
-
-
-
-