一种数据依赖的数据质量检测方法及装置

    公开(公告)号:CN105701199B

    公开(公告)日:2019-04-26

    申请号:CN201610016515.X

    申请日:2016-01-08

    Abstract: 本发明为一种数据依赖的数据质量检测方法及装置,所述方法包括:步骤b,分析参照文件,根据所述参照文件各字段具有不同值的个数判断该字段所处级别,并将各字段的值组织成所述参照文件的树形结构;步骤c,接收待检测数据,根据所述参照文件的所述字段的名称及其对应级别信息,确定所述待检测数据待检测字段与参照级别的映射,并组织成所述待检测字段的树形结构;步骤d,遍历所述参照文件的树形结构,在所述待检测字段的树形结构对应位置上查找值,并做出标记;所述装置包括与各个步骤相对应的参照文件分析单元、数据依赖规则定义单元和数据依赖规则检查单元。这样,可以在检查过程中准确定位错误的发生源,且大大提高了检测速度和效率。

    一种能源互联网直流电网及设备建模方法

    公开(公告)号:CN110445165A

    公开(公告)日:2019-11-12

    申请号:CN201910684145.0

    申请日:2019-07-26

    Abstract: 本发明公开了一种能源互联网直流电网及设备建模方法,包括以下步骤:选择一个经典的直流设备扩展模型,并在导线端添加直流架空线和电缆、设置单位长度直流线路参数、在导电设备和开关之间的直流母线上连接换流器、交直流变换器、直流斩波器和接地线、添加直流侧电流源换流器和直流侧电压源换流器、在导电设备和开关之间的添加在分流装置和串联装置、在开关端添加隔离开关以及断路器上添加直流断路器;本发明通过在经典的直流设备扩展模型上进行扩展添加,扩展后的直流设备扩展模型内的直流断路器可以保证能源互联网直流电网及设备模型系统能够安全高效的进行运行,提高了能源互联网直流电网及设备模型系统的供电能力和运行效率。

    一种数据依赖的数据质量检测方法及装置

    公开(公告)号:CN105701199A

    公开(公告)日:2016-06-22

    申请号:CN201610016515.X

    申请日:2016-01-08

    CPC classification number: G06F17/30303

    Abstract: 本发明为一种数据依赖的数据质量检测方法及装置,所述方法包括:步骤b,分析参照文件,根据所述参照文件各字段具有不同值的个数判断该字段所处级别,并将各字段的值组织成所述参照文件的树形结构;步骤c,接收待检测数据,根据所述参照文件的所述字段的名称及其对应级别信息,确定所述待检测数据待检测字段与参照级别的映射,并组织成所述待检测字段的树形结构;步骤d,遍历所述参照文件的树形结构,在所述待检测字段的树形结构对应位置上查找值,并做出标记;所述装置包括与各个步骤相对应的参照文件分析单元、数据依赖规则定义单元和数据依赖规则检查单元。这样,可以在检查过程中准确定位错误的发生源,且大大提高了检测速度和效率。

    一种基于k-means聚类的分箱方法

    公开(公告)号:CN104537067A

    公开(公告)日:2015-04-22

    申请号:CN201410839779.6

    申请日:2014-12-30

    CPC classification number: G06F17/30598

    Abstract: 本发明公开了一种基于k-means聚类的分箱方法,包括以下步骤:对连续变量进行预处理;对预处理后的数据进行归一化处理;将归一化处理过的数据,应用k-means聚类算法,划分为多个区间:采用等距法设定k-means聚类算法的初始中心,得到聚类中心;在得到聚类中心后将相邻的聚类中心的中点作为分类的划分点,将各个对象加入到距离最近的类中,从而将数据划分为多个区间;重新计算每个聚类中心,然后重新划分数据,直到每个聚类中心不再变化,得到最终的聚类结果。本发明解决了现有分箱方法对于数据密度分布偏向明显的数据集容易造成误差的技术问题,k-means聚类算法在选取初始中心时不再是随机选取,数据分箱结果准确。

Patent Agency Ranking