基于分子内聚力理论的数据聚类方法

    公开(公告)号:CN102087667A

    公开(公告)日:2011-06-08

    申请号:CN201110032779.1

    申请日:2011-01-30

    Applicant: 福州大学

    CPC classification number: Y02D10/45

    Abstract: 本发明涉及一种基于分子内聚力理论的数据聚类方法,其特征在于:对于高维空间上具有N个数据点的数据集,设每个数据点为一个分子,设多个数据点形成的聚类为分子团,基于分子内聚力理论进行数据聚类:步骤一:计算两两数据点之间的内聚力能量值并保存;步骤二:各数据点并行寻找能使合并总能量降低且降到最低的数据点,与其合并为一个聚类,通过该步骤得到多个聚类和未聚类的数据点;步骤三:各数据点和聚类并行寻找能使合并总能量降低且降到最低的数据点或聚类,与其合并为一个新的聚类;步骤四:重复步骤(3),直至所有数据点或聚类都无法使其他数据点或聚类能量降低,所有数据点聚类完成。该方法不用事先估计类别数目,提高了聚类结果的准确性。

Patent Agency Ranking