数据质量级别判断方法
    1.
    发明授权

    公开(公告)号:CN102609418B

    公开(公告)日:2015-02-04

    申请号:CN201110023938.1

    申请日:2011-01-21

    Inventor: 齐志英

    Abstract: 本发明提供了一种数据质量级别判断方法,包括以下步骤:将获取的目标数据群传送至服务器;提取目标数据群中每个目标数据的特征向量,并将特征向量进行字符转换,得到每个特征向量对应的字符集数据;将每个字符集数据根据服务器中存储的级别标准进行检验,得到每个特征向量的质量级别编码;以及将每个目标数据及其对应的质量级别编码返回用户。本发明通过服务器中存储的级别标准能对目标数据群的质量进行检验,得到目标数据群所对应的质量级别编码,并返回给用户;其检验速度快,准确性高;用户可以根据每个目标数据及其对应的质量级别编码进行相应的处理。

    一种基于特征向量的聚合数据快速查找方法

    公开(公告)号:CN102622354A

    公开(公告)日:2012-08-01

    申请号:CN201110029247.2

    申请日:2011-01-27

    Inventor: 徐贵水

    Abstract: 本发明提供了一种基于特征向量的聚合数据快速查找方法,包括的步骤为:将目标数据的聚合数据进行格式化处理,得到结构化数据;将结构化数据的具有指向性属性的属性因子作为特征向量,并建立特征向量指向的结构化数据的聚合属性集合,聚合属性集合包含结构化数据对应的属性;将目标数据的元数据进行处理,得到包括特征向量的元数据索引;以及存储特征向量及其指向的聚合属性集合,以待调用;根据查找条件,提取对应的特征向量;以及获取特征向量指向的聚合属性集合。通过本发明的方法可实现聚合数据的快速查找及维护。

    相似数据排重方法
    3.
    发明公开

    公开(公告)号:CN102609419A

    公开(公告)日:2012-07-25

    申请号:CN201110023939.6

    申请日:2011-01-21

    Inventor: 杨健

    Abstract: 本发明提供了一种相似数据排重方法,包括以下步骤:将所获取的相似数据输入至服务器;提取相似数据的特征向量,对特征向量的每个信息进行预处理,得到每个信息的字符型索引数据;对每个索引数据进行编码转换,生成每个信息的数值型哈希数据;以及根据信息的权重,逐一判断特征向量的哈希数据与数据库服务器中存储的标准数据信息是否为相同的数据,并将结果返回给用户。通过本发明的方法可以快速的对数据不同但反应信息相同的相似数据进行排重处理,且其正确率高,稳定性好。

    一种基于特征向量的聚合数据快速查找方法

    公开(公告)号:CN102622354B

    公开(公告)日:2014-08-13

    申请号:CN201110029247.2

    申请日:2011-01-27

    Inventor: 徐贵水

    Abstract: 本发明提供了一种基于特征向量的聚合数据快速查找方法,包括的步骤为:将目标数据的聚合数据进行格式化处理,得到结构化数据;将结构化数据的具有指向性属性的属性因子作为特征向量,并建立特征向量指向的结构化数据的聚合属性集合,聚合属性集合包含结构化数据对应的属性;将目标数据的元数据进行处理,得到包括特征向量的元数据索引;以及存储特征向量及其指向的聚合属性集合,以待调用;根据查找条件,提取对应的特征向量;以及获取特征向量指向的聚合属性集合。通过本发明的方法可实现聚合数据的快速查找及维护。

    数据质量级别判断方法
    5.
    发明公开

    公开(公告)号:CN102609418A

    公开(公告)日:2012-07-25

    申请号:CN201110023938.1

    申请日:2011-01-21

    Inventor: 齐志英

    Abstract: 本发明提供了一种数据质量级别判断方法,包括以下步骤:将获取的目标数据群传送至服务器;提取目标数据群中每个目标数据的特征向量,并将特征向量进行字符转换,得到每个特征向量对应的字符集数据;将每个字符集数据根据服务器中存储的级别标准进行检验,得到每个特征向量的质量级别编码;以及将每个目标数据及其对应的质量级别编码返回用户。本发明通过服务器中存储的级别标准能对目标数据群的质量进行检验,得到目标数据群所对应的质量级别编码,并返回给用户;其检验速度快,准确性高;用户可以根据每个目标数据及其对应的质量级别编码进行相应的处理。

    相似数据排重方法
    6.
    发明授权

    公开(公告)号:CN102609419B

    公开(公告)日:2015-02-18

    申请号:CN201110023939.6

    申请日:2011-01-21

    Inventor: 杨健

    Abstract: 本发明提供了一种相似数据排重方法,包括以下步骤:将所获取的相似数据输入至服务器;提取相似数据的特征向量,对特征向量的每个信息进行预处理,得到每个信息的字符型索引数据;对每个索引数据进行编码转换,生成每个信息的数值型哈希数据;以及根据信息的权重,逐一判断特征向量的哈希数据与数据库服务器中存储的标准数据信息是否为相同的数据,并将结果返回给用户。通过本发明的方法可以快速的对数据不同但反应信息相同的相似数据进行排重处理,且其正确率高,稳定性好。

Patent Agency Ranking