一种基于粒球的快速密度峰值聚类的推荐分析方法

    公开(公告)号:CN118260479A

    公开(公告)日:2024-06-28

    申请号:CN202410172580.6

    申请日:2024-02-07

    Abstract: 本发明为一种基于粒球的快速密度峰值聚类的推荐分析方法,包括数据收集、特征提取、粒球划分、计算粒球的密度及截止距离,并使用密度峰值聚类算法对粒球进行聚类以得到聚类结果,最后生成推荐列表。本发明引入了粒球计算,使用粒球代替原本的数据点进行聚类,降低了密度峰值聚类算法的时间复杂度,从而使运行速度更快,更适合推荐系统的大规模数据集的聚类。并且通过将粒球和密度峰值聚类算法结合,提出通过粒球本身的数据计算其密度的密度公式,使得聚类算法无需设置参数,避免因参数设置不准确而导致的聚类效果不好的情况发生。

    一种基于粒球的DBSCAN的词义聚类方法

    公开(公告)号:CN117932374A

    公开(公告)日:2024-04-26

    申请号:CN202410061598.9

    申请日:2024-01-16

    Abstract: 本发明属于自然语言处理领域,具体涉及一种基于粒球的DBSCAN的词义聚类方法,包括:获取待聚类的文本数据,对文本数据进行词语划分,得到词数据集;根据词数据集生成对应的粒球,并确定各个粒球的密度值;设置阈值,将各个粒球的密度值与设置的阈值进行对比,若小于设置的阈值,则将该粒球划分为非核心粒球,否则为核心粒球;根据核心粒球的密度可达关系对核心粒球进行聚类合并,生成类簇;将非核心粒球分配到对应的类簇中,完成聚类;本发明可以用更简单的参数调节步骤,更小的时间复杂度得到高准确率的聚类结果,为词义聚类相关领域提供更高效和更准确的解决方案。

    一种基于高斯分布粒球的基因聚类分析方法

    公开(公告)号:CN118298930A

    公开(公告)日:2024-07-05

    申请号:CN202410150096.3

    申请日:2024-02-02

    Abstract: 本发明公开了一种基于高斯分布粒球的基因聚类分析方法,包括获取基因表达数据,对基因表达数据的预处理,基于KL散度的无监督粒球划分,基于高斯分布粒球的最小生成树聚类,从而得到最终的聚类结果后返回。本发明巧妙地将基于KL散度划分的粒球与最小生成树相结合,相较于以往基于粒球的聚类,可以利用KL散度在粒球具有高斯分布时停止划分,得到更少的粒球个数,为后续结合最小生成树聚类提供了更少的数据点,显著提升了聚类的效果,使得数据分类更为精确。通过与粒球的协同作用,本发明不仅减少了所需的计算数据量,降低了计算的复杂性,而且进一步提高了聚类的精度,有助于更好研究基因的未知功能,具有良好的应用前景。

    一种用于遥感图像分类的粒球最小生成树聚类方法

    公开(公告)号:CN118154913A

    公开(公告)日:2024-06-07

    申请号:CN202410055897.1

    申请日:2024-01-15

    Abstract: 本发明涉及数据挖掘领域,具体涉及一种用于遥感图像分类的粒球最小生成树聚类方法,包括对遥感图像数据进行无监督粒球划分,并对划分结果进行低质量过滤处理得到多个粒球;获取每一个粒球的边缘点组,根据边缘点组计算每两个粒球间的距离;以粒球为顶点,每两个粒球间的距离为边权值,采用Prim算法生成最小生成树;按照边权值大小,将最小生成树中的所有边降序排列得到序列边集合;根据序列边集合进行边删除处理得到聚类结果;本发明不仅能够更有效地处理大规模数据,同时在捕捉不规则形状聚类和过滤噪声对象方面表现更为准确。

    一种基于超像素和基于粒球改进的图像分割方法

    公开(公告)号:CN117765263A

    公开(公告)日:2024-03-26

    申请号:CN202410047400.1

    申请日:2024-01-11

    Abstract: 本发明公开了一种基于超像素和基于粒球改进的图像分割方法,通过SLIC算法,得到超像素分割的结果,经过特征提取,以获得高维特征向量,接着使用基于粒球改进的ISOMAP提取重要特征,最后将这些特征作为DPC聚类算法的输入,得到最终的聚类结果,解决了现有技术没有考虑超像素的高维特征和特征间的非线性关系,从而导致了输出图像不够准确的问题。

Patent Agency Ranking