一种计算机快速海量数据聚类处理方法

    公开(公告)号:CN103744935A

    公开(公告)日:2014-04-23

    申请号:CN201310748302.2

    申请日:2013-12-31

    Inventor: 李中 杨宏 张珂

    CPC classification number: G06F17/30595

    Abstract: 一种计算机快速海量数据聚类处理方法,所述方法首先对待分析数据对象进行预处理,完成数据对象的分组,然后计算组内数据对象的相似度矩阵,并依据相似度大小合并生成新数据对象,记录合并生成过程同时删除旧数据对象,如此反复操作直至数据对象的数目等于用户期待的聚类分类数,最后通过查询合并记录获取聚类处理结果。本方法一次执行过程可直接获得任意聚类数的各个子类数据对象的具体构成、子类数据对象数目及其质心,并可查询得到各个子类内部数据对象分布概况与及其特征,极大地方便了海量数据的快速有效处理。

    一种向量间相似度的计算方法

    公开(公告)号:CN101488190A

    公开(公告)日:2009-07-22

    申请号:CN200910073836.3

    申请日:2009-02-27

    Inventor: 李中 苑津莎 杨宏

    Abstract: 一种向量间相似度的计算方法,属数据识别技术领域,用于判断向量间的相似度。其技术方案是:定义n维向量xj与xk间的相似度距离是:dSSD(j,k)=ED×[1+COS(ASD/MSAD×π/2)]或dMSD(j,k)=ED×(2-ASD/MSAD),则n维向量xj与xk之间相似度是:s(j,k)=1/(dSSD+1)或s(j,k)=1/(dMSD+1),其数值越大,则两者越相似,反之,则差异越大。本发明不但考虑了向量间各维差值绝对值的和,而且考虑了向量间各维差值的具体特征,因而比传统方法具有更高的精度,更能逼近实际。

    一种计算机快速海量数据聚类处理方法

    公开(公告)号:CN103744935B

    公开(公告)日:2017-06-06

    申请号:CN201310748302.2

    申请日:2013-12-31

    Inventor: 李中 杨宏 张珂

    Abstract: 一种计算机快速海量数据聚类处理方法,所述方法首先对待分析数据对象进行预处理,完成数据对象的分组,然后计算组内数据对象的相似度矩阵,并依据相似度大小合并生成新数据对象,记录合并生成过程同时删除旧数据对象,如此反复操作直至数据对象的数目等于用户期待的聚类分类数,最后通过查询合并记录获取聚类处理结果。本方法一次执行过程可直接获得任意聚类数的各个子类数据对象的具体构成、子类数据对象数目及其质心,并可查询得到各个子类内部数据对象分布概况与及其特征,极大地方便了海量数据的快速有效处理。

    一种基于样本统计特征的TLS模型参数估计方法

    公开(公告)号:CN107766652A

    公开(公告)日:2018-03-06

    申请号:CN201710990631.6

    申请日:2017-10-23

    Inventor: 杨宏

    CPC classification number: G06F17/5009 G06Q50/06

    Abstract: 本发明公开了一种基于样本统计特征的TLS模型参数估计方法,包括输入样本数据、根据样本计算均值,方差和峰度系数;估计位置参数;估计形状参数和估计尺度参数。本发明根据样本均值,方差和峰度系数等统计特征计算TLS分布的模型参数,极大地缩短了建模所需的时间,特别适用于风电调度和管理中实时性要求较高的工作场合。

Patent Agency Ranking