-
公开(公告)号:CN118260479A
公开(公告)日:2024-06-28
申请号:CN202410172580.6
申请日:2024-02-07
Applicant: 重庆邮电大学
IPC: G06F16/9535 , G06F16/906 , G06F18/2321 , G06F18/2135 , G06N3/006
Abstract: 本发明为一种基于粒球的快速密度峰值聚类的推荐分析方法,包括数据收集、特征提取、粒球划分、计算粒球的密度及截止距离,并使用密度峰值聚类算法对粒球进行聚类以得到聚类结果,最后生成推荐列表。本发明引入了粒球计算,使用粒球代替原本的数据点进行聚类,降低了密度峰值聚类算法的时间复杂度,从而使运行速度更快,更适合推荐系统的大规模数据集的聚类。并且通过将粒球和密度峰值聚类算法结合,提出通过粒球本身的数据计算其密度的密度公式,使得聚类算法无需设置参数,避免因参数设置不准确而导致的聚类效果不好的情况发生。
-
公开(公告)号:CN117932374A
公开(公告)日:2024-04-26
申请号:CN202410061598.9
申请日:2024-01-16
Applicant: 重庆邮电大学
IPC: G06F18/2321 , G06F16/35 , G06F40/216 , G06F40/30
Abstract: 本发明属于自然语言处理领域,具体涉及一种基于粒球的DBSCAN的词义聚类方法,包括:获取待聚类的文本数据,对文本数据进行词语划分,得到词数据集;根据词数据集生成对应的粒球,并确定各个粒球的密度值;设置阈值,将各个粒球的密度值与设置的阈值进行对比,若小于设置的阈值,则将该粒球划分为非核心粒球,否则为核心粒球;根据核心粒球的密度可达关系对核心粒球进行聚类合并,生成类簇;将非核心粒球分配到对应的类簇中,完成聚类;本发明可以用更简单的参数调节步骤,更小的时间复杂度得到高准确率的聚类结果,为词义聚类相关领域提供更高效和更准确的解决方案。
-
公开(公告)号:CN118298930A
公开(公告)日:2024-07-05
申请号:CN202410150096.3
申请日:2024-02-02
Applicant: 重庆邮电大学
IPC: G16B40/30 , G06F18/23213
Abstract: 本发明公开了一种基于高斯分布粒球的基因聚类分析方法,包括获取基因表达数据,对基因表达数据的预处理,基于KL散度的无监督粒球划分,基于高斯分布粒球的最小生成树聚类,从而得到最终的聚类结果后返回。本发明巧妙地将基于KL散度划分的粒球与最小生成树相结合,相较于以往基于粒球的聚类,可以利用KL散度在粒球具有高斯分布时停止划分,得到更少的粒球个数,为后续结合最小生成树聚类提供了更少的数据点,显著提升了聚类的效果,使得数据分类更为精确。通过与粒球的协同作用,本发明不仅减少了所需的计算数据量,降低了计算的复杂性,而且进一步提高了聚类的精度,有助于更好研究基因的未知功能,具有良好的应用前景。
-
公开(公告)号:CN118154913A
公开(公告)日:2024-06-07
申请号:CN202410055897.1
申请日:2024-01-15
Applicant: 重庆邮电大学
IPC: G06V10/762 , G06V10/764 , G06V10/778
Abstract: 本发明涉及数据挖掘领域,具体涉及一种用于遥感图像分类的粒球最小生成树聚类方法,包括对遥感图像数据进行无监督粒球划分,并对划分结果进行低质量过滤处理得到多个粒球;获取每一个粒球的边缘点组,根据边缘点组计算每两个粒球间的距离;以粒球为顶点,每两个粒球间的距离为边权值,采用Prim算法生成最小生成树;按照边权值大小,将最小生成树中的所有边降序排列得到序列边集合;根据序列边集合进行边删除处理得到聚类结果;本发明不仅能够更有效地处理大规模数据,同时在捕捉不规则形状聚类和过滤噪声对象方面表现更为准确。
-
公开(公告)号:CN117765263A
公开(公告)日:2024-03-26
申请号:CN202410047400.1
申请日:2024-01-11
Applicant: 重庆邮电大学
IPC: G06V10/26 , G06V10/762 , G06V10/74
Abstract: 本发明公开了一种基于超像素和基于粒球改进的图像分割方法,通过SLIC算法,得到超像素分割的结果,经过特征提取,以获得高维特征向量,接着使用基于粒球改进的ISOMAP提取重要特征,最后将这些特征作为DPC聚类算法的输入,得到最终的聚类结果,解决了现有技术没有考虑超像素的高维特征和特征间的非线性关系,从而导致了输出图像不够准确的问题。
-
-
-
-