-
公开(公告)号:CN103164531B
公开(公告)日:2016-03-23
申请号:CN201310116388.7
申请日:2013-04-03
Applicant: 河海大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于模糊优先级的二阶段实例层数据集成方法,属于数据集成技术领域。所述二阶段实例层数据集成方法首先确定待集成记录所属分布式存储节点的优先级指标及每个指标的权重,并采用三角模糊数来表示模糊优先级;数据集成时,根据投票机制区分出实例层的强弱冲突;若为弱冲突,则采用多数一致属性值作为集成后的结果;若为强冲突,则通过构建去模糊化的融合决策矩阵,计算每条记录与正理想解的隶属度来决定集成所采用的属性值。本发明解决了在海量数据集成中集成效率低或集成结果精度低等问题。
-
公开(公告)号:CN104750870A
公开(公告)日:2015-07-01
申请号:CN201510187185.6
申请日:2015-04-20
Applicant: 河海大学
IPC: G06F17/30
Abstract: 本发明公开一种基于HBase的日志存储系统及实现方法,属于大数据存储技术领域。该系统包括四大功能模块:用户管理模块,用于用户注册、信息审核、管理员分配存储空间和对用户的基本情况进行管理;日志管理模块,用于申请系统账号、管理系统账号、自定义日志类型、管理日志类型以及日志的查询和下载;远程服务调用模块,用于用户系统调用服务器发布的Web Service服务,包括身份验证服务和日志远程存储服务;系统查询模块,用于剩余空间量的查询和展示及站内信联系管理员,提供多种形式的图表展示。本发明采用分布式Hadoop的HBase数据库作为日志存储容器,能够满足海量数据的存储需求并充分利用Hadoop集群廉价、相对稳定的存储特点。
-
公开(公告)号:CN103281395A
公开(公告)日:2013-09-04
申请号:CN201310229094.5
申请日:2013-06-08
Applicant: 河海大学
Inventor: 冯钧 , 胥世民 , 唐志贤 , 李士进 , 朱跃龙 , 万定生 , 许潇 , 徐黎明 , 朱祖会 , 冯读庆 , 任锋 , 盛震宇 , 史涯晴 , 姜康 , 朱康康 , 陈焕霖 , 刘子源
IPC: H04L29/08
Abstract: 本发明公开一种基于客户端数量的数据片均分选择系统及方法,属于信息技术处理领域。系统包括服务器端、Tracker服务器和客户端。方法包括以下步骤:服务器端对数据进行编码形成种子文件,并解析种子文件连接到Tracker服务器;服务器端把种子文件和数据片选择顺序的参数发送给客户端;客户端收到种子文件和数据片选择顺序的参数后,解析种子文件,根据种子文件的数据片数量和数据片选择顺序的参数进行数据片选择和数据下载。本发明解决了数据片随机选择策略中BitTorrent系统中数据片分布不均的问题。
-
-