-
公开(公告)号:CN114742155B
公开(公告)日:2024-11-26
申请号:CN202210375631.6
申请日:2022-04-11
Applicant: 中南大学
IPC: G06F18/241 , G06F18/2321
Abstract: 本发明公开了一种基于随机采样聚类的带噪音数据分类方法,包括获取带噪音的待分类数据集并随机采样,将采样数据加到中心点集完成初始化;对数据集进行迭代:每次迭代时获取距离中心点集最远的若干个数据点并采样部分数据加入到中心点集中;对中心点集中的数据进行枚举并获取代价最小的若干个数据点作为聚类的中心点;将数据集中的各个数据点分配到距离自身最近的中心点上完成分类。本发明还公开了一种包括所述于随机采样聚类的带噪音数据分类方法的用户分类方法。本发明通过创新的分类步骤和计算方式,不仅实现了带噪音数据的分类,而且分类精度较高,可靠性高,实用性好且算法复杂度较低。
-
公开(公告)号:CN114742155A
公开(公告)日:2022-07-12
申请号:CN202210375631.6
申请日:2022-04-11
Applicant: 中南大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于随机采样聚类的带噪音数据分类方法,包括获取带噪音的待分类数据集并随机采样,将采样数据加到中心点集完成初始化;对数据集进行迭代:每次迭代时获取距离中心点集最远的若干个数据点并采样部分数据加入到中心点集中;对中心点集中的数据进行枚举并获取代价最小的若干个数据点作为聚类的中心点;将数据集中的各个数据点分配到距离自身最近的中心点上完成分类。本发明还公开了一种包括所述于随机采样聚类的带噪音数据分类方法的用户分类方法。本发明通过创新的分类步骤和计算方式,不仅实现了带噪音数据的分类,而且分类精度较高,可靠性高,实用性好且算法复杂度较低。
-