-
公开(公告)号:CN118779676A
公开(公告)日:2024-10-15
申请号:CN202410943885.2
申请日:2024-07-15
Applicant: 济南大学
IPC: G06F18/23 , G06F18/15 , G06F18/25 , G06N3/045 , G06N3/0455 , G06N3/0475 , G06N3/0895 , G06N3/094
Abstract: 本公开提出一种融合多重填充和注意力机制的对比不完全数据聚类方法,包括:采用链式方程多重填充算法对原始不完整数据集进行填充,得到具有多视图数据的填充数据集;将填充数据集输入自编码器中,基于编码器得到每个视图的潜在特征;采用注意力机制融合每个视图的潜在特征,得到融合潜在特征;将融合潜在特征输入解码器,得到重构特征;根据潜在特征和重构特征计算重构损失;基于映射的融合潜在特征中的正样本对和负样本对进行对比学习,计算对比学习损失;基于生成对抗网络对融合潜在特征进行聚类,计算聚类损失;根据损失函数对自编码器进行训练。提高了不完全数据填充的准确性、有效挖掘不同视图间的共享特征信息,提高聚类准确性。
-
公开(公告)号:CN116881455A
公开(公告)日:2023-10-13
申请号:CN202310837734.4
申请日:2023-07-10
Applicant: 济南大学
IPC: G06F16/35 , G06F40/279 , G06N3/04
Abstract: 本发明属于自然语言处理领域,提供了基于对比学习及图嵌入优化的文本聚类方法及系统,其技术方案为:采用对比学习并结合图嵌入方法,既考虑了数据的全局结构,又结合了特征的局部图结构。图嵌入充分利用原始高维样本空间的近邻先验信息,对低维表示空间的嵌入施加约束,以保证原始样本的连接强度在隐层特征中得到反映。利用样本和最近的邻居之间的相关性来弥补只依靠全局结构所造成的聚类中心偏差,达到提高聚类精度的目的,从而从高数据量、高稀疏的文本数据集中得到准确的聚类结果。
-
公开(公告)号:CN116644327A
公开(公告)日:2023-08-25
申请号:CN202310638508.3
申请日:2023-05-30
Applicant: 济南大学
IPC: G06F18/23213 , G06F18/214 , G06F18/213 , G06F18/22
Abstract: 本发明提出了一种基于协同训练的深度多视图聚类方法及系统,涉及数据挖掘和机器学习领域,具体方案包括:获取待聚类的多视图,用每个视图预训练自己的深度自编码模型;计算每个视图的亲和矩阵,设置每个视图的初始权重和视图间的初始动态学习因子;对每个视图的深度自编码模型进行迭代的正式训练,更新每个视图的权重和视图间的动态学习因子,直到满足预设的迭代停止条件,输出最终的隐层特征和聚类中心;基于最终的隐层特征和聚类中心,得到聚类结果;本发明设计了基于动态协同训练的深度多视图加权图嵌入聚类算法,针对多视图数据,采用动态协同训练思想,深入挖掘多视图间的互补信息,提高面向于多视图数据集的聚类效果。
-
公开(公告)号:CN116662833A
公开(公告)日:2023-08-29
申请号:CN202310589312.X
申请日:2023-05-22
Applicant: 济南大学
Abstract: 本发明公开了一种基于高斯混合模型的多视图动态迁移聚类方法及系统,该方法包括:获取待聚类的多视图数据集,预设每个视图的视图权重和各视图之间的动态迁移学习因子的初始值;分别对每个视图中的数据样本进行聚类,根据聚类结果计算获取每一视图的高斯混合模型参数初始值以及每一视图中每一数据属于每一簇的隶属度;根据隶属度更新高斯混合模型参数、视图权重和动态迁移学习因子;以更新后的值为最新值,对每个视图进行隶属度迭代计算,直至迭代结束;根据最终迭代获取的动态迁移学习因子进行各视图之间的聚类学习,得到各视图趋于一致的聚类结果。本发明通过动态迁移学习技术实现多视图间互补信息的深入挖掘,提高多视图数据的聚类性能。
-
公开(公告)号:CN118585840A
公开(公告)日:2024-09-03
申请号:CN202410922820.X
申请日:2024-07-10
Applicant: 济南大学
IPC: G06F18/23 , G06F18/214 , G06F17/11 , G06F18/25 , G06N5/04
Abstract: 本发明属于数据挖掘技术领域,提供了基于多重填充及变分网络的不完全数据聚类方法及系统,包括获取待聚类的不完全数据集;对缺失数据进行多重推断,得到多个填充结果;将填充结果编码为潜在表示,融合潜在分布,得到共享潜在分布;从高斯混合模型中选择一个聚类,根据所选聚类产生共享潜在变量,利用高斯混合模型计算聚类分配概率;定义目标函数,计算前后两次迭代的目标函数值之间的差值,如果满足设定条件,则终止迭代,如果不满足则重复执行上述步骤。本发明解决了传统的不完全数据聚类方法填充与聚类部分分离、推断过程无法获得足够的信息来处理高维数据的问题。
-
-
-
-