-
公开(公告)号:CN109408782A
公开(公告)日:2019-03-01
申请号:CN201811216206.2
申请日:2018-10-18
Applicant: 中南大学
Abstract: 本发明公开了一种基于KL距离相似性度量的研究热点演变行为检测方法,其将刊物主题性和刊物的时序性相结合,提出了时序刊物主题模型TS-JTM,以实现学术刊物的时态热点抽取,在此基础上建立基于时间序列的主题快照刊物研究热点演变模型,同时,利用概率分布KL距离相似性度量方法,提出了度量相邻时刻主题快照中主题演变行为的检测方法,以实现对刊物中研究热点演变的细粒度分析。
-
公开(公告)号:CN109992610A
公开(公告)日:2019-07-09
申请号:CN201910264138.5
申请日:2019-04-03
Applicant: 中南大学
IPC: G06F16/2458 , G06F16/242 , G06F16/27 , G06F9/50
Abstract: 本发明提供了基于频繁模式树二维特征的负载均衡方法,方法针对传统算法对计算量估算考虑不全的问题,综合考虑了影响频繁模式树计算量的宽度和深度二维特征,方法首先根据频繁模式树宽度和深度特征对频繁一项集中的项进行计算量预估,然后根据预估结果使用基于贪心策略的方法对频繁一项估算集进行分组。方法主要解决了在并行频繁模式挖掘中数据分配不均而导致的计算效率降低的问题,实现了在大规模并行计算平台下快速高效地进行频繁模式挖掘。实验结果表明,方法有效地提高了计算节点间的负载均衡效果,且具有良好的并行性和可扩展性。
-
公开(公告)号:CN109471877A
公开(公告)日:2019-03-15
申请号:CN201811292708.3
申请日:2018-11-01
Applicant: 中南大学
IPC: G06F16/2455 , G06F16/2458
Abstract: 本发明提供了一种面向流数据的增量式时态频繁模式并行挖掘方法,包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建。本发明在获取了当前数据集的K-项集计数后通过历史的频繁模式树和历史次频繁模式的信息对每个频繁模式的时态频繁度进行更新计算,将更新完时态频繁度的频繁模式根据阈值分别加入到时态频繁模式集合和时态次频繁模式集合中。本发明能以最小的空间代价来保存时态频繁模式的历史信息,提高频繁模式挖掘的准确性。
-
公开(公告)号:CN109471877B
公开(公告)日:2022-04-22
申请号:CN201811292708.3
申请日:2018-11-01
Applicant: 中南大学
IPC: G06F16/2455 , G06F16/2458
Abstract: 本发明提供了一种面向流数据的增量式时态频繁模式并行挖掘方法,包括两部分,第一部分为时态频繁模式和时态次频繁模式的增量式挖掘,第二部分是时态频繁模式树的重建。本发明在获取了当前数据集的K‑项集计数后通过历史的频繁模式树和历史次频繁模式的信息对每个频繁模式的时态频繁度进行更新计算,将更新完时态频繁度的频繁模式根据阈值分别加入到时态频繁模式集合和时态次频繁模式集合中。本发明能以最小的空间代价来保存时态频繁模式的历史信息,提高频繁模式挖掘的准确性。
-
公开(公告)号:CN109408782B
公开(公告)日:2020-07-03
申请号:CN201811216206.2
申请日:2018-10-18
Applicant: 中南大学
IPC: G06F40/194 , G06F40/284
Abstract: 本发明公开了一种基于KL距离相似性度量的研究热点演变行为检测方法,其将刊物主题性和刊物的时序性相结合,提出了时序刊物主题模型TS‑JTM,以实现学术刊物的时态热点抽取,在此基础上建立基于时间序列的主题快照刊物研究热点演变模型,同时,利用概率分布KL距离相似性度量方法,提出了度量相邻时刻主题快照中主题演变行为的检测方法,以实现对刊物中研究热点演变的细粒度分析。
-
-
-
-