基于网址域名的文本分词方法、系统、设备及介质

    公开(公告)号:CN111104801A

    公开(公告)日:2020-05-05

    申请号:CN201911367979.5

    申请日:2019-12-26

    Applicant: 济南大学

    Abstract: 本发明公开了基于网址域名的文本分词方法、系统、设备及介质,包括:数据采集,采集若干个网址域名;对每个网址域名进行分词处理;将分词处理后的单词进行文本格式化处理;分析文本格式化处理后得到单词的单词词性;根据单词词性进行词形还原;将词形还原后的结果存储到单词库中;将待分词的网址域名,采用双向最大匹配算法与单词库进行匹配,如果匹配成功,则得到文本向量化结果;如果匹配失败,则对待分词的网址域名进行清洗,将清洗后的结果再次采用双向最大匹配算法与单词库进行匹配。

    一种面向流程对象的工业过程建模预测方法

    公开(公告)号:CN104732067A

    公开(公告)日:2015-06-24

    申请号:CN201510088090.9

    申请日:2015-02-26

    Applicant: 济南大学

    Abstract: 本发明公开了一种面向流程对象的工业过程建模预测方法,包括如下步骤:FNT模型建立,从流程对象已经生成的数据仓库中抽取工业流程对象原始数据集S,创建FNT模型的初始种群,种群个体数目根据需要定制,每个个体表示一个FNT模型;利用PIPE算法优化FNT模型结构,适应值函数采用均方误差或均方根误差;利用微粒群(PSO)算法优化FNT模型参数;利用FNT模型对流程对象生产过程进行建模预测。本发明基于柔性神经树获取流程对象各测点数据的变化趋势公式,对工业生产过程进行模拟,基于当前生产状态的相关参数预测未来一段时间的生产状态,从而辅助指导企业调整生产流程参数,在微观上引导生产趋利避害。

    基于数据流聚类的工业设备运行状态划分方法及系统

    公开(公告)号:CN115221959A

    公开(公告)日:2022-10-21

    申请号:CN202210842724.5

    申请日:2022-07-18

    Applicant: 济南大学

    Abstract: 本发明提出了基于数据流聚类的工业设备运行状态划分方法及系统,涉及工业设备运行状态划分领域。包括:获取工业设备用电数据;对用电数据提取特征并对提取的特征进行预处理;为预处理后的数据分配动态权重,并将预处理后的数据合并在微簇结构中,更新微簇结构;利用基于自然邻居的密度峰值聚类方法对微簇结构中的数据进行聚类,根据聚类结果匹配工业设备的运行状态。本发明采用动态权重的方法来更加精确的描述以及更新数据的概要信息,采用基于自然邻居的密度峰值聚类算法来完成最终的聚类任务,提升了工业设备运行状态的判断准确度。

    基于数据集成聚类的工业燃煤锅炉工况划分方法及系统

    公开(公告)号:CN115169456A

    公开(公告)日:2022-10-11

    申请号:CN202210780261.4

    申请日:2022-07-04

    Applicant: 济南大学

    Abstract: 本发明属于数据聚类技术领域,提供了一种基于数据集成聚类的工业燃煤锅炉工况划分方法及系统,获取工业燃煤锅炉的运行状态数据;本发明通过混合代表近邻近似、二部图分割和三阶张量集成三个步骤,对工业燃煤锅炉数据进行集成聚类操作,对锅炉数据实现有效的工况划分;具体的,通过混合代表近邻近似构建稀疏亲和子矩阵,可以解决传统的聚类方法计算时间复杂度太高,不能有效构建燃煤锅炉数据的亲和矩阵的问题,通过对二部图进行划分,减少了特征问题求解时间,以及通过将多基聚类结果集成到一个统一的集成聚类框架中,在保持高效率的同时进一步提高了聚类的准确性和鲁棒性。

    基于异质信息网络的疾病预测系统

    公开(公告)号:CN114883001A

    公开(公告)日:2022-08-09

    申请号:CN202210570384.5

    申请日:2022-05-24

    Abstract: 本发明公开了基于异质信息网络的疾病预测系统,包括:获取模块,其被配置为:获取待预测患者的当前电子病历;疾病预测模块,其被配置为:将待预测患者的当前电子病历,输入到训练后的疾病预测模型中,输出疾病预测结果;其中,疾病预测模型的工作原理为:对待预测患者的当前电子病历进行数据扩充,基于扩充后的数据构建电子病历异质图;在电子病历异质图上,基于元路径的学习表示进行电子病历的嵌入表示,通过注意力机制进行元路径邻居节点的聚合;最终实现对待预测患者的疾病预测。以便准确预测患者是否存在潜在疾病,对患者做出准确地预测。

    基于自适应模糊聚类的热电工业数据异常检测方法及系统

    公开(公告)号:CN110472690B

    公开(公告)日:2022-03-25

    申请号:CN201910768987.4

    申请日:2019-08-20

    Applicant: 济南大学

    Abstract: 本公开提供一种基于自适应模糊聚类的热电工业数据异常检测方法及系统。其中,热电工业数据异常检测方法包括实时获取d维度的热电工业数据作为样本,按照时间顺序存储至数据集S;将数据集S所分布空间的每一维划均分为相等的m个间隔段,生成不相交的网格;将数据集S中的映射到网格中计算各个网格的重心,作为新的数据点来代表相应网格内所包含的热电工业数据,形成网格重心数据集;利用自适应模糊聚类算对网格重心数据集P进行聚类,得到所有聚类中心;计算网格重心数据集中每个数据点所对应网格包含的热电工业数据与其最邻近的聚类中心的距离并与预设距离阈值比较,进而判断热电工业数据是否异常。

    一种基于大数据分层聚类的棉花生产工艺优化方法

    公开(公告)号:CN109034486A

    公开(公告)日:2018-12-18

    申请号:CN201810884575.2

    申请日:2018-08-06

    Applicant: 济南大学

    CPC classification number: G06Q10/04 G06Q10/063

    Abstract: 本发明提供一种基于大数据分层聚类的棉花生产工艺优化方法,包括如下步骤:对获取的生产监测原始数据进行数据预处理;对经过预处理后的原始数据确定描述参数属性的关键参数;对确定的关键参数进行数值统计得到分布统计属性数值分布分组;根据分布统计中得到的数值分布分组,使样本中各项属性数据分别映射到各属性分组区间中,形成新的数据集;确定优化目标,进行生产工艺参数的优化。结合棉花加工流程工艺分析。可以用于企业对工艺参数的分析调整。从而优化棉花生产、提高棉花质量、维护企业生产安全。

    一种面向流程对象数据的规则提取方法

    公开(公告)号:CN104346442B

    公开(公告)日:2017-10-20

    申请号:CN201410541881.8

    申请日:2014-10-14

    Applicant: 济南大学

    Abstract: 本发明涉及一种面向流程对象数据的规则提取方法,包括如下步骤:步骤S1:确定流程对象数据的最佳聚簇数量;步骤S2:采用K‑means算法对流程对象数据进行聚类,同时验证步骤S1中的最佳聚簇数量的合理性,如果步骤S1中的最佳聚簇数量合理则转到步骤S3,否则转到步骤S1;步骤S3:采用Apriori维间关联规则算法挖掘不同测点的聚类间的关联规则;步骤S4:确定流程对象数据的最强关联链;步骤S5:根据最强关联链上所有测点的状态值,得到记载各测点状态值的状态链,根据状态链对相关行业进行指导;提高数据规则提取的效率,以及从流程对象数据中提取知识的能力。

    外置式数据处理装置
    30.
    实用新型

    公开(公告)号:CN202939603U

    公开(公告)日:2013-05-15

    申请号:CN201220661412.6

    申请日:2012-12-04

    Applicant: 济南大学

    Inventor: 刘鹏 徐伟 曲守宁

    Abstract: 本实用新型公开了一种外置式数据处理装置,它包括易拆卸壳体,设置在壳体内的电路板、CPU和存储器,以及设置在壳体上的电源接口和USB接口,所述CPU和存储器均设置在电路板上,所述电源接口和USB接口分别与电路板连接。本实用新型具有以下有益效果:1)通过该外置式数据处理装置增强了终端设备的数据处理能力。2)可以逐步代替内部嵌入式的中央处理器设备,节省了机器升级的成本,极大避免了资源浪费。3)降低了设备的重复性生产、购买和使用。本实用新型不仅能与目前的各种台式机、笔记本、手机通过usb接口或者micro-usb接口连接,而且可以与安装有无线接收模块的设备进行无线连接,实现数据的交互传递。

Patent Agency Ranking