一种局部加权的不完整数据混杂聚类方法

    公开(公告)号:CN107766887A

    公开(公告)日:2018-03-06

    申请号:CN201710993558.8

    申请日:2017-10-23

    Applicant: 辽宁大学

    CPC classification number: G06K9/6223 G06N3/126

    Abstract: 本发明涉及一种局部加权的不完整数据混杂聚类方法,其步骤如下:(1)收集数据;(2)数据处理:随机使部分数据缺少部分属性,变成不完整数据;(3)数据估算:利用改进的遗传算法中的个体对缺失数据进行估算;(4)聚类分析:对估算的数据进行模糊聚类分析;本发明提出了一种改进的遗传算法优化局部加权的不完整数据混杂聚类算法(GLW-FCM),达到搜索全部问题空间找到最优解的目的。使用UCI标准测试数据集包括:Iris、Bupa、Wine和Breast。将本文所提出的算法与其他五种算法在Matlab环境下做对比实验分析,改进后的算法在整个问题空间隐含了并行性进行搜索最佳解,获得了更加理想的聚类结果。有效降低了平均误分数、平均错误分类标准差和平均迭代终止次数。

    一种自适应区间的不完整数据加权聚类方法

    公开(公告)号:CN110197216A

    公开(公告)日:2019-09-03

    申请号:CN201910431765.3

    申请日:2019-05-23

    Applicant: 辽宁大学

    Abstract: 本发明涉及一种自适应区间的不完整数据加权聚类方法,步骤如下:(1)确定最近邻样本;(2)自适应区间化填补缺失数据;(3)提出自适应区间型数据加权模糊C均值聚类;(4)利用步骤(3)中聚类方法对步骤(2)中得到的区间型数据集进行聚类,得到聚类结果,与四种经典方法和四种近几年相关学者提出的方法进行实验结果对比,以此验证本发明的有效性。利用UCI数据库中的生物数据集鸢尾花Iris、医疗数据集乳腺癌症Breast和医学数据集成年人肝病Bpua,在四种缺失率的情况下与四种经典方法和四种近几年相关学者提出的方法进行实验,证明本发明方法有更高的聚类准确率。

Patent Agency Ranking