基于EMD度量的对偶正则化非负矩阵分解的聚类方法

    公开(公告)号:CN111753894A

    公开(公告)日:2020-10-09

    申请号:CN202010536081.2

    申请日:2020-06-12

    Abstract: 本发明提供一种基于EMD度量的对偶正则化非负矩阵分解的聚类方法,所述方法包括以下步骤:步骤一:获取待聚类的样本数据;步骤二:针对待聚类样本构建其数据流形图的邻接矩阵和特征流形图的邻接矩阵;步骤三:通过数据流形图正则化项与特征流形图正则化项,得到基于EMD度量的对偶正则化非负矩阵分解的目标函数;步骤四:根据目标函数使用迭代加权的方法,设置迭代次数,对NMF中的系数矩阵与基矩阵进行迭代更新;步骤五:采用k-means聚类算法对迭代更新后的数据样本进行聚类。利用几何结构信息量提高NMF的性能,采用EMD的度量方式更好地度量样本之间的距离。

    一种基于Hadoop的改进型FP-Growth数据挖掘方法

    公开(公告)号:CN110232079A

    公开(公告)日:2019-09-13

    申请号:CN201910379325.8

    申请日:2019-05-08

    Abstract: 本发明公开了一种基于Hadoop的改进型FP-Growth数据挖掘方法,属于数据挖掘领域。在已有的FP-Growth算法并行化的基础上改进,主要方法是在FP-tree在构建项头表数据结构的时候在原有的项头表结构上添加一个新的属性尾节点tail,用于记录每一个数据项当前的最后一个节点,然后可以直接通过tail属性找到表尾进行新节点的插入,来加速FP-tree构建;此外,采用先序遍历FP-tree的方法产生条件模式基来提高挖掘效率。且根据不同数据集长度构建FP-tree复杂差异可能较大,可能会导致某些节点负载过大的问题,通过负载均衡算法可以用来均衡工作负载,减少数据分配时的随机性的问题。

    一种基于对偶局部一致的约束稀疏概念分解的聚类方法

    公开(公告)号:CN111930934A

    公开(公告)日:2020-11-13

    申请号:CN202010507876.0

    申请日:2020-06-05

    Abstract: 本发明公开了一种基于对偶局部一致的约束稀疏概念分解的聚类方法,其特征在于,包括:S10获取待聚类样本形成待聚类样本数据集;S20针对所述待聚类样本数据集构建邻接矩阵;S30建立基于概念分解的目标函数JDESCFS;S40根据所述目标函数使用迭代加权的方法迭代预设次数,对基矩阵W、标签矩阵A和辅助矩阵Z进行更新;S50采用K-Means聚类算法对系数矩阵V进行聚类分析,其中,V=AZ。与传统的聚类方法相比,更加有效地揭示数据的内在几何结构和判别结构,提升了聚类的效果。

    基于局部约束自适应邻域自表示流形概念分解的聚类方法

    公开(公告)号:CN111950614A

    公开(公告)日:2020-11-17

    申请号:CN202010758137.9

    申请日:2020-07-31

    Abstract: 本发明提供了一种基于局部约束自适应邻域的自表示流形概念分解方法,包括:S10获取待聚类样本数据集;S20针对待聚类样本数据集构建邻接权重矩阵;S30基于局部连通性自适应地为待聚类样本数据集中每个数据点分配邻域以学习关联矩阵;S40建立包含图正则项、自适应邻域正则项及局部稀疏项的基于概念分解的目标函数;S50根据目标函数使用迭代加权的方法迭代预设次数,得到待聚类样本数据集的特征矩阵;S60采用K-Means聚类算法对得到的特征矩阵进行聚类,完成对待聚类样本数据集的聚类,解决现有聚类方法中聚类结果对输入数据敏感的问题。

    一种分布式函数依赖关系挖掘方法

    公开(公告)号:CN109697206A

    公开(公告)日:2019-04-30

    申请号:CN201811558260.5

    申请日:2018-12-19

    Abstract: 本发明涉及传统的函数依赖关系挖掘算法和分布式并行置信度计算领域,具体为一种分布式函数依赖关系挖掘方法;分布式函数依赖关系挖掘方法,帮助企业发现分布在各个节点上的公共规则,为企业决策提供基础:包括以下步骤:(1)对分布式环境下每个节点的原始数据进行函数依赖挖掘,得到相应的函数依赖候选集;(2)根据步骤(1)中的结果,对其进行初步剪枝,得到新的函数依赖候选集;(3)针对步骤(2)中的结果,根据候选函数依赖的左部特征对其进行分组,每一组内的候选函数依赖的LHS部分拥有公共的属性;(4)每次选取一个属性作为LHS公共属性,根据步骤(3)的分组方法对分布式的数据进行重分布;(5)对重分布数据进行置信度检测。

    一种基于对偶局部一致的约束稀疏概念分解的聚类方法

    公开(公告)号:CN111930934B

    公开(公告)日:2023-12-26

    申请号:CN202010507876.0

    申请日:2020-06-05

    Abstract: 本发明公开了一种基于对偶局部一致的约束稀疏概念分解的聚类方法,其特征在于,包括:S10获取待聚类样本形成待聚类样本数据集;S20针对所述待聚类样本数据集构建邻接矩阵;S30建立基于概念分解的目标函数JDESCFS;S40根据所述目标函数使用迭代加权的方法迭代预设次数,对基矩阵W、标签矩阵A和辅助矩阵Z进行更新;S50采用K‑Means聚类算法对系数矩阵V进行聚类分析,其中,V=AZ。与传统的聚类方法相比,更加有效地揭示数据的内在几何结构和判别结构,提升了聚类的效果。

    基于多流形对偶图正则化非负矩阵分解的多视图聚类方法

    公开(公告)号:CN110990775B

    公开(公告)日:2023-11-07

    申请号:CN201911190170.X

    申请日:2019-11-28

    Abstract: 本发明提供了一种基于多流形对偶图正则化非负矩阵分解的多视图聚类方法,包括:S10获取待聚类视图;S20针对每个待聚类视图构建数据图的邻接矩阵和特征图的邻接矩阵;S30通过一致性系数及多视图局部嵌入得到多流形对偶图正则化非负矩阵分解的目标函数;S40根据目标函数使用迭代加权的方法迭代预设次数,对每个待聚类视图数据图的邻接矩阵、特征图的邻接矩阵及图正则项进行更新,得到各待聚类视图的特征矩阵;S50采用k‑means聚类算法分别对每个待聚类视图的特征矩阵进行分析,实现多视图聚类。该聚类方法与传统的多视图聚类方法相比,更加有效地利用视图数据中包含的结构信息及特征,大大提升了聚类效果,带来了更好的聚类性能。

    基于图正则化的平滑范数受限非负矩阵分解的聚类方法

    公开(公告)号:CN111401403A

    公开(公告)日:2020-07-10

    申请号:CN202010099641.2

    申请日:2020-02-18

    Abstract: 本发明提供了一种基于图正则化的平滑范数受限非负矩阵分解的聚类方法,包括:S10获取待聚类视图并构建最邻近图;S20构建基于图正则化的LP平滑范数受限非负矩阵分解的目标函数,目标函数中包括用于保持数据空间内几何结构和提高平滑度的平滑正则化项及用于标记样本类别信息的图正则项;S30以Frobenius范数为度量标准,根据目标函数使用迭代加权的方法迭代预设次数,得到待聚类视图的特征矩阵;S40采用k-means聚类算法分别对各聚类视图的特征矩阵进行分析,实现视图聚类。其通过加入图正则项到NMF中,发现隐藏语义同时尊重数据集固有的内在几何信息;再通过将标签信息作为附加的硬约束使得高维空间中标记的样本在新低维空间中拥有相同的坐标;最后加入LP平滑范数,以提高平滑度。

    基于多流形对偶图正则化非负矩阵分解的多视图聚类方法

    公开(公告)号:CN110990775A

    公开(公告)日:2020-04-10

    申请号:CN201911190170.X

    申请日:2019-11-28

    Abstract: 本发明提供了一种基于多流形对偶图正则化非负矩阵分解的多视图聚类方法,包括:S10获取待聚类视图;S20针对每个待聚类视图构建数据图的邻接矩阵和特征图的邻接矩阵;S30通过一致性系数及多视图局部嵌入得到多流形对偶图正则化非负矩阵分解的目标函数;S40根据目标函数使用迭代加权的方法迭代预设次数,对每个待聚类视图数据图的邻接矩阵、特征图的邻接矩阵及图正则项进行更新,得到各待聚类视图的特征矩阵;S50采用k-means聚类算法分别对每个待聚类视图的特征矩阵进行分析,实现多视图聚类。该聚类方法与传统的多视图聚类方法相比,更加有效地利用视图数据中包含的结构信息及特征,大大提升了聚类效果,带来了更好的聚类性能。

Patent Agency Ranking