-
公开(公告)号:CN111104801B
公开(公告)日:2023-09-26
申请号:CN201911367979.5
申请日:2019-12-26
Applicant: 济南大学
IPC: G06F40/289 , G06F40/242 , G06F40/232 , G06F16/33
Abstract: 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。
-
公开(公告)号:CN109034486B
公开(公告)日:2022-03-29
申请号:CN201810884575.2
申请日:2018-08-06
Applicant: 济南大学
Abstract: 本发明提供一种基于大数据分层聚类的棉花生产工艺优化方法,包括如下步骤:对获取的生产监测原始数据进行数据预处理;对经过预处理后的原始数据确定描述参数属性的关键参数;对确定的关键参数进行数值统计得到分布统计属性数值分布分组;根据分布统计中得到的数值分布分组,使样本中各项属性数据分别映射到各属性分组区间中,形成新的数据集;确定优化目标,进行生产工艺参数的优化。结合棉花加工流程工艺分析。可以用于企业对工艺参数的分析调整。从而优化棉花生产、提高棉花质量、维护企业生产安全。
-
公开(公告)号:CN113688934A
公开(公告)日:2021-11-23
申请号:CN202111026341.2
申请日:2021-09-02
Applicant: 济南大学
Abstract: 本发明公开了一种基于迁移学习分布式期望最大化金融数据聚类方法,用于细分金融领域分布式P2P网络环境下的客户数据。包括:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移;对于各个节点上的每个数据点进行类别划分。本发明通过在分布式期望最大化算法中引入迁移学习项,能够显示揭示节点间的协作机制,加速算法收敛,同时,提高聚类精度,精准细分金融客户。
-
公开(公告)号:CN110163255B
公开(公告)日:2021-11-16
申请号:CN201910324141.1
申请日:2019-04-22
Applicant: 济南大学
IPC: G06K9/62 , G06F16/2455 , G06F16/2458
Abstract: 本公开公开了一种基于密度峰值的数据流聚类方法及装置,以密度峰值和模糊聚类方法为基础,首次提出的疑似离群点的概念,以宽度自适应采样窗口模型以及空间‑时间衰减机制为主要创新点,以提高算法对数据流聚类的效率为主要目标和出发点,创新性地提出了一种新的数据流聚类方法及装置,即一种基于密度峰值的数据流聚类方法及装置,在保障可观的聚类精度前提下,获得更高效的数据流聚类效果。
-
公开(公告)号:CN110019845B
公开(公告)日:2021-04-09
申请号:CN201910303799.4
申请日:2019-04-16
Applicant: 济南大学
IPC: G06F16/36 , G06F16/332
Abstract: 本公开公开了一种基于知识图谱的社区演化分析方法及装置,该方法包括:调取数据库中某领域特定时间的文献信息,构建待分析关系网络;检测每个时间步的待分析关系网络的社区结构;构建相同无序对比例矩阵计算相似性阈值,根据两个社区的所述相同无序对比例的值与相似性阈值判断两个社区间的相似性;根据社区间的相似性构建社区相似矩阵,进行社区匹配,采用非连续时间步跟踪社区演化依次获得每个社区的演化序列,同时检测社区生命周期中的关键事件,并统计所述关键事件的数量来反映社区的演化状况。
-
公开(公告)号:CN109063769B
公开(公告)日:2021-04-09
申请号:CN201810864958.3
申请日:2018-08-01
Applicant: 济南大学
IPC: G06K9/62
Abstract: 本发明公开了基于变异系数自动确认簇数量的聚类方法、系统及介质,计算数据集中每个数据点的密度值,根据密度值计算密度指数,选择密度指数最大的数据点作为第一个聚类中心;计算每个数据点与当前已有聚类中心之间的最短距离,然后根据最短距离计算每个数据点被选为聚类中心的概率,按照轮盘法预选聚类中心;直至选择出设定个聚类中心,根据选择出的初始聚类中心进行k‑means聚类从而产生相应个数的簇;计算平均簇内变异系数和最小簇间变异系数,然后,计算平均簇内变异系数和最小簇间变异系数的差值,将差值与设定值进行比较,如果差值小于设定值,则将两个簇间变异系数最小的两个簇进行合并;直至差值大于等于设定值,则输出聚类结果。
-
公开(公告)号:CN111104801A
公开(公告)日:2020-05-05
申请号:CN201911367979.5
申请日:2019-12-26
Applicant: 济南大学
IPC: G06F40/289 , G06F40/242 , G06F40/232 , G06F16/33
Abstract: 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。
-
公开(公告)号:CN104732067A
公开(公告)日:2015-06-24
申请号:CN201510088090.9
申请日:2015-02-26
Applicant: 济南大学
IPC: G06F19/00
Abstract: 本发明公开了一种面向流程对象的工业过程建模预测方法,包括如下步骤:FNT模型建立,从流程对象已经生成的数据仓库中抽取工业流程对象原始数据集S,创建FNT模型的初始种群,种群个体数目根据需要定制,每个个体表示一个FNT模型;利用PIPE算法优化FNT模型结构,适应值函数采用均方误差或均方根误差;利用微粒群(PSO)算法优化FNT模型参数;利用FNT模型对流程对象生产过程进行建模预测。本发明基于柔性神经树获取流程对象各测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数,在微观上引导生产趋利避害。
-
公开(公告)号:CN118779676A
公开(公告)日:2024-10-15
申请号:CN202410943885.2
申请日:2024-07-15
Applicant: 济南大学
IPC: G06F18/23 , G06F18/15 , G06F18/25 , G06N3/045 , G06N3/0455 , G06N3/0475 , G06N3/0895 , G06N3/094
Abstract: 本公开提出一种融合多重填充和注意力机制的对比不完全数据聚类方法,包括:采用链式方程多重填充算法对原始不完整数据集进行填充,得到具有多视图数据的填充数据集;将填充数据集输入自编码器中,基于编码器得到每个视图的潜在特征;采用注意力机制融合每个视图的潜在特征,得到融合潜在特征;将融合潜在特征输入解码器,得到重构特征;根据潜在特征和重构特征计算重构损失;基于映射的融合潜在特征中的正样本对和负样本对进行对比学习,计算对比学习损失;基于生成对抗网络对融合潜在特征进行聚类,计算聚类损失;根据损失函数对自编码器进行训练。提高了不完全数据填充的准确性、有效挖掘不同视图间的共享特征信息,提高聚类准确性。
-
公开(公告)号:CN113688934B
公开(公告)日:2024-06-07
申请号:CN202111026341.2
申请日:2021-09-02
Applicant: 济南大学
IPC: G06F18/23213 , G06F17/16 , G06F17/18 , G06N20/00
Abstract: 本发明公开了一种基于迁移学习分布式期望最大化金融数据聚类方法,用于细分金融领域分布式P2P网络环境下的客户数据。包括:获取待聚类客户金融数据的业务部门并将各部门数据进行集群分布式存储;各个节点分别进行聚类分析,得到初始聚类结果,并基于各个节点上的初始聚类结果进行统计分析,得到迁移学习的初始模型参数集合;根据设定的目标函数,基于当前模型参数集合计算当前模型目标函数值;在邻居节点之间进行模型参数迁移;对于各个节点上的每个数据点进行类别划分。本发明通过在分布式期望最大化算法中引入迁移学习项,能够显示揭示节点间的协作机制,加速算法收敛,同时,提高聚类精度,精准细分金融客户。
-
-
-
-
-
-
-
-
-