一种大数据上的均值近似聚集方法

    公开(公告)号:CN106934059A

    公开(公告)日:2017-07-07

    申请号:CN201710175458.4

    申请日:2017-03-22

    Abstract: 一种大数据上的均值近似聚集方法,本发明涉及一种大数据上的近似聚集方法。本发明的目的是为了解决现有方法的采样顺序敏感、需要用户参与观测、计算结果精度低的问题。一、在需要进行均值聚集计算的包含M个数据的数据集中随机采一个包含m个个体的样本,求出一个粗略均值和样本标准差;二、用户给定指定的精度,求出满足精度所需要的采样率;三、确定需要进行均值聚集计算的数据集的数据边界,得到一个表示需要进行均值聚集计算的数据集的数据边界的参数;四、将参数传到每一个计算单元内,得到每一个计算单元内的均值;五、将每一个计算单元内的均值进行整合,输出最终结果。本发明用于金融,统计等领域。

    一种钢管的长度大数据上的均值近似聚集方法

    公开(公告)号:CN106934059B

    公开(公告)日:2019-10-22

    申请号:CN201710175458.4

    申请日:2017-03-22

    Abstract: 一种大数据上的均值近似聚集方法,本发明涉及一种大数据上的近似聚集方法。本发明的目的是为了解决现有方法的采样顺序敏感、需要用户参与观测、计算结果精度低的问题。一、在需要进行均值聚集计算的包含M个数据的数据集中随机采一个包含m个个体的样本,求出一个粗略均值和样本标准差;二、用户给定指定的精度,求出满足精度所需要的采样率;三、确定需要进行均值聚集计算的数据集的数据边界,得到一个表示需要进行均值聚集计算的数据集的数据边界的参数;四、将参数传到每一个计算单元内,得到每一个计算单元内的均值;五、将每一个计算单元内的均值进行整合,输出最终结果。本发明用于金融,统计等领域。

Patent Agency Ranking