一种计算机快速海量数据聚类处理方法

    公开(公告)号:CN103744935A

    公开(公告)日:2014-04-23

    申请号:CN201310748302.2

    申请日:2013-12-31

    Inventor: 李中 杨宏 张珂

    CPC classification number: G06F17/30595

    Abstract: 一种计算机快速海量数据聚类处理方法,所述方法首先对待分析数据对象进行预处理,完成数据对象的分组,然后计算组内数据对象的相似度矩阵,并依据相似度大小合并生成新数据对象,记录合并生成过程同时删除旧数据对象,如此反复操作直至数据对象的数目等于用户期待的聚类分类数,最后通过查询合并记录获取聚类处理结果。本方法一次执行过程可直接获得任意聚类数的各个子类数据对象的具体构成、子类数据对象数目及其质心,并可查询得到各个子类内部数据对象分布概况与及其特征,极大地方便了海量数据的快速有效处理。

    基于免疫抗体网络的模式识别方法

    公开(公告)号:CN101561880A

    公开(公告)日:2009-10-21

    申请号:CN200910074328.7

    申请日:2009-05-11

    Inventor: 李中 苑津莎

    Abstract: 一种基于免疫抗体网络的模式识别方法,用于模式识别。其技术方案是:它以随机抽取一定数目的各类训练样本,生成免疫抗体网络中的初始抗体,完成免疫抗体网络的初始化;以所有训练样本作为输入抗原,根据抗体生成算法对免疫抗体网络进行训练,有效提取各类训练样本的模式特征;反复训练免疫抗体网络,当连续两次训练结果一致时,训练终止并保存得到的免疫抗体网络,进行模式识别。本发明计算简便,无需人工设置参数与阈值,具有很高的正确识别率,适合于字体识别、故障诊断等计算机应用领域。

    一种向量间相似度的计算方法

    公开(公告)号:CN101488190A

    公开(公告)日:2009-07-22

    申请号:CN200910073836.3

    申请日:2009-02-27

    Inventor: 李中 苑津莎 杨宏

    Abstract: 一种向量间相似度的计算方法,属数据识别技术领域,用于判断向量间的相似度。其技术方案是:定义n维向量xj与xk间的相似度距离是:dSSD(j,k)=ED×[1+COS(ASD/MSAD×π/2)]或dMSD(j,k)=ED×(2-ASD/MSAD),则n维向量xj与xk之间相似度是:s(j,k)=1/(dSSD+1)或s(j,k)=1/(dMSD+1),其数值越大,则两者越相似,反之,则差异越大。本发明不但考虑了向量间各维差值绝对值的和,而且考虑了向量间各维差值的具体特征,因而比传统方法具有更高的精度,更能逼近实际。

    一种基于表面振动信号分析的变压器在线监测方法

    公开(公告)号:CN106768262B

    公开(公告)日:2019-07-26

    申请号:CN201611040125.2

    申请日:2016-11-11

    Abstract: 本发明属于信号处理技术领域,尤其涉及一种基于表面振动信号分析的变压器在线监测方法,包括如下步骤:S1,根据变压器运行电压、负载电流、油温历史数据以及变压器表面振动历史数据训练广义回归神经网络;S2,应用所述广义回归神经网络,根据变压器实时运行数据计算变压器表面基频振动幅值;S3,根据振动基频振动幅值的计算值与实测值差异,判断变压器运行状态,实现变压器振动在线监测。本发明提供了一种可靠、准确的基于振动分析的监测方法。

    一种计算机快速海量数据聚类处理方法

    公开(公告)号:CN103744935B

    公开(公告)日:2017-06-06

    申请号:CN201310748302.2

    申请日:2013-12-31

    Inventor: 李中 杨宏 张珂

    Abstract: 一种计算机快速海量数据聚类处理方法,所述方法首先对待分析数据对象进行预处理,完成数据对象的分组,然后计算组内数据对象的相似度矩阵,并依据相似度大小合并生成新数据对象,记录合并生成过程同时删除旧数据对象,如此反复操作直至数据对象的数目等于用户期待的聚类分类数,最后通过查询合并记录获取聚类处理结果。本方法一次执行过程可直接获得任意聚类数的各个子类数据对象的具体构成、子类数据对象数目及其质心,并可查询得到各个子类内部数据对象分布概况与及其特征,极大地方便了海量数据的快速有效处理。

    基于免疫抗体网络的模式识别方法

    公开(公告)号:CN101655911B

    公开(公告)日:2012-05-30

    申请号:CN200910164886.2

    申请日:2009-08-07

    Inventor: 李中 苑津莎

    Abstract: 一种基于免疫抗体网络的模式识别方法,用于模式识别。其技术方案是:它以随机抽取一定数目的各类训练样本,生成免疫抗体网络中的初始抗体,完成免疫抗体网络的初始化;以所有训练样本作为输入抗原,根据抗体生成算法对免疫抗体网络进行训练,有效提取各类训练样本的模式特征;反复训练免疫抗体网络,当连续两次训练结果一致时,训练终止并保存得到的免疫抗体网络,进行模式识别。本发明计算简便,无需人工设置参数与阀值,具有很高的正确识别率,适合于字体识别、故障诊断等计算机应用领域。

    一种基于表面振动信号分析的变压器在线监测方法

    公开(公告)号:CN106768262A

    公开(公告)日:2017-05-31

    申请号:CN201611040125.2

    申请日:2016-11-11

    CPC classification number: G01H1/16

    Abstract: 本发明属于信号处理技术领域,尤其涉及一种基于表面振动信号分析的变压器在线监测方法,包括如下步骤:S1,根据变压器运行电压、负载电流、油温历史数据以及变压器表面振动历史数据训练广义回归神经网络;S2,应用所述广义回归神经网络,根据变压器实时运行数据计算变压器表面基频振动幅值;S3,根据振动基频振动幅值的计算值与实测值差异,判断变压器运行状态,实现变压器振动在线监测。本发明提供了一种可靠、准确的基于振动分析的监测方法。

    一种基于降维和抽样的数据聚类方法

    公开(公告)号:CN105913077A

    公开(公告)日:2016-08-31

    申请号:CN201610213963.9

    申请日:2016-04-07

    CPC classification number: G06K9/6223

    Abstract: 一种基于降维和抽样的数据聚类方法,所述方法首先通过分段均值法对数据集进行降维处理,然后构造随机函数从大规模的聚类数据集中进行随机抽样,得到规模较小的工作集,并在工作集上进行k?means聚类,得到随机抽样聚类结果,最后通过衡量剩下的聚类样本与已经得到的抽样聚类结果的关系,对剩余样本进行分类。本发明采用降维和抽样的方法减少参与迭代的数据集样本的数目和维度,在保持良好聚类效果的情况下,大大降低了k?means算法的复杂度,从而实现了大规模数据的高效聚类。

Patent Agency Ranking