-
公开(公告)号:CN111159406A
公开(公告)日:2020-05-15
申请号:CN201911393493.9
申请日:2019-12-30
Applicant: 内蒙古工业大学
IPC: G06F16/35
Abstract: 本发明属于文本聚类技术领域,尤其涉及基于并行改进的K-means算法的大数据文本聚类方法及系统,通过Canopy中心点选取算法和K-means基于距离的聚类算法相结合的SWCK-means文本聚类算法处理将低维度的大数据文本数据进行聚类,本发明解决了现有技术存在由于K-means算法没有最优化或局部优化处理,从而导致算法的聚类的准确率和效率低下的问题,具有提高了K-means算法的聚类的准确率和效率、减少文本的维度、提高聚类的效果以及并行化设计的有益技术效果。
-
公开(公告)号:CN110766237A
公开(公告)日:2020-02-07
申请号:CN201911049432.0
申请日:2019-10-31
Applicant: 内蒙古工业大学
Abstract: 本发明属于公交客流量预测技术领域,尤其涉及基于SPGAPSO-SVM算法的公交客流量预测方法及系统,其包括通过基于大规模数据处理的快速通用计算引擎平台的弹性分布式数据集进行种群的构建、切分和并行化处理,并输出最优系统参数,本发明解决了现有技术存在现有预测模型计算适应度消耗时间过长的问题,具有较高的预测准确率、较快的运行速度和良好的可扩展性的有益技术效果。
-
公开(公告)号:CN111241812A
公开(公告)日:2020-06-05
申请号:CN202010020654.6
申请日:2020-01-09
Applicant: 内蒙古工业大学
IPC: G06F40/216 , G06F40/289 , G06F16/335 , G06F16/35 , G06K9/62
Abstract: 本发明属于文本聚类技术领域,尤其涉及基于并行改进的K-means算法的大数据文本聚类试验方法及系统,本方法包括对非结构化文本数据进行预处理、准确性试验、加速比实验、扩展性实验,本发明解决了对并行改进的K-means算法进行如算法准确性试验、加速比实验、扩展性实验等有效性验证是非常重要的问题,具有对并行改进的K-means算法是有效的验证的有益技术效果。
-
-