一种面向空间数据连接操作的分布式数据存取方法

    公开(公告)号:CN104239469A

    公开(公告)日:2014-12-24

    申请号:CN201410444716.0

    申请日:2014-09-03

    Applicant: 河海大学

    Inventor: 陆佳民 冯钧

    CPC classification number: G06F17/30318 G06F17/30545

    Abstract: 本发明涉及一种面向空间数据连接操作的分布式数据存取方法,属于信息技术处理领域。本方法公开了空间数据的分离存取方法,将空间数据连接操作的不同阶段:过滤与精化,与分布式计算过程MapReduce进行有机结合。本发明不仅明确了MapReduce框架内空间数据连接操作的基本过程,同时提出了通用的针对空间数据操作的远程有效数据存取过程,筛选并远程存取操作相关数据,达到降低网络传输代价的目的。

    一种面向任意段数据的Top-k查询方法

    公开(公告)号:CN102799681B

    公开(公告)日:2014-11-12

    申请号:CN201210257640.1

    申请日:2012-07-24

    Applicant: 河海大学

    Abstract: 本发明公开一种面向任意段数据的Top-k查询方法,首先进行采集数据;然后分析数据特点,根据数据特点建立索引结构:若数据量较小,DG索引已经建好,则进入基于DG索引的任意段数据Top-k查询;若数据量较大,DG索引上的结点较为稀疏时,则进入基于双层支配图DDG索引结构的Top-k查询;若当任意段确定比较困难时,则进入基于DG和GS的混合索引查询。该方法具有能够适合全局Top-k查询和任意段数据的部分Top-k查询的索引,提高Top-k查询应用的自由性和任意性。

    基于Hadoop的海量空间数据索引更新系统及方法

    公开(公告)号:CN102799679B

    公开(公告)日:2014-10-22

    申请号:CN201210255699.7

    申请日:2012-07-24

    Applicant: 河海大学

    Abstract: 本发明公开了基于Hadoop的海量空间数据索引更新系统及方法,属于信息技术处理领域。所述系统包括:数据更新模块、索引操作缓存模块、索引文件更新模块、索引文件创建模块、索引文件读取模块。所述方法中:数据更新模块用于获取空间数据的更新情况,并将相应的索引更新信息写入索引操作缓存模块;索引文件创建模块用于按照索引节点为单位在磁盘上创建物理文件;索引更新模块再利用索引读取模块读取的节点信息对比索引缓存的节点信息,将满足条件的索引节点信息写入新索引文件。本发明解决了由于Hadoop平台仅支持对文件的追加写操作而造成对更新频繁的动态空间数据支持不足的问题,实时可靠地更新Hadoop平台中空间索引信息。

    基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统

    公开(公告)号:CN104102875A

    公开(公告)日:2014-10-15

    申请号:CN201410351264.1

    申请日:2014-07-22

    Applicant: 河海大学

    CPC classification number: G06F11/3409 G06K9/6278

    Abstract: 本发明公开了一种基于加权朴素贝叶斯分类器的软件服务质量的监控方法及监控系统,方法通过构造的加权朴素贝叶斯分类器判断软件的QoS属于满足标准类、不满足标准类还是无法判断,训练时设定影响因子组合,影响因子即非软件本身对QoS的影响,计算影响因子组合权值以及先验知识,监控时由分类器得到监控结果,分析、存储并返回评价给数据服务端。系统包括:控制器,采集不同的服务质量声明,向观察器发布不同服务质量所需的数据标准指令,传递需与数据集匹配的QoS标准给训练器,控制采集周期以及频率;数据库汇总分析器的监控结果;服务能力评价模块向数据服务设备返回软件的监控结果和评价结果;还包括观察器、训练器、优化样本集和分析器。

    基于英文文字特征的碎纸机破碎文档复原方法

    公开(公告)号:CN103996180A

    公开(公告)日:2014-08-20

    申请号:CN201410185991.5

    申请日:2014-05-05

    Applicant: 河海大学

    Abstract: 本发明公开了基于英文文字特征的碎纸机破碎文档复原方法,属于图像处理的技术领域。文档复原方法包括图像数字化、图像预处理、图像聚类和图像拼接四个步骤。图像预处理是指运用matlab软件导入每张碎纸片,生成对应于每张碎纸片的灰度矩阵以及对灰度矩阵进行二值化处理,并生成二值序列;图像聚类步骤是指根据英文文字特征,对二值序列进行渲染,并根据渲染结果对原始图像进行聚类;图像拼接步骤是指根据聚类结果,基于最小累积边缘距离原则,对原始图像进行纵向拼接,再对纵向拼接之后的结果进行横向拼接。本发明解决了被碎纸机破碎后的英文文档的复原问题,填补了现有技术的空白,同时,通过聚类,使拼接效率得以大大提高。

    一种基于云平台的元数据索引模型及方法

    公开(公告)号:CN103744960A

    公开(公告)日:2014-04-23

    申请号:CN201410004932.3

    申请日:2014-01-06

    Applicant: 河海大学

    CPC classification number: G06F17/30321

    Abstract: 本发明公开一种基于云平台的元数据索引模型及方法,模型包括:全量索引模块,主要解决对遗留数据和迁移数据建立全量索引的问题;增量索引模块,主要解决审核通过的元数据以增量的方式加入索引库;索引管理模块,用于对索引的基本管理需求。方法通过构建提供元数据建立索引的一套SaaS服务。租户通过迁移或者注册流程存储元数据到元数据存储中心,对迁移的元数据采用建立全量索引的方式,对通过注册流程存储的元数据,调用建立增量索引接口,以增量的方式向索引库添加数据;建立索引使用分布式检索工具Elasticsearch完成。本发明建立索引速度具有明显提升,能够达到实时搜索,具有良好的可扩展性。

    一种多度量时间序列相似分析方法

    公开(公告)号:CN103577562A

    公开(公告)日:2014-02-12

    申请号:CN201310508432.9

    申请日:2013-10-24

    Applicant: 河海大学

    CPC classification number: G06F17/30988

    Abstract: 本发明公开一种多度量时间序列相似分析方法,适用于时间序列的k-近邻查询。根据分析需求选择多个单一相似度量方法,分别利用各单一相似度量分析查询序列的m-近邻序列或子序列;对各相似度量下的m-近邻序列或子序列进行修剪,得到候选相似序列或子序列;利用带优势权重的多分类器组合法对候选相似序列或子序列进行组合得到查询序列的k-近邻序列。相对于单一相似度量,多度量组合的相似分析能够得到更加全面的分析结果。带优势权重的多分类器组合法在借鉴BORDA计数法的同时,利用相邻候选相似序列或子序列与查询序列的相似距离的差异对排序得分进行调整,以反映候选相似序列或子序列相似的具体差异。

    一种基于TIN数据的河网提取方法

    公开(公告)号:CN102810157A

    公开(公告)日:2012-12-05

    申请号:CN201110115791.9

    申请日:2011-06-02

    Applicant: 河海大学

    Abstract: 本发明涉及一种基于TIN数据的河网提取方法,属于地理信息与水文学技术领域。本法利用TIN三角形的梯度判断水流方向,在求得流向的基础上,通过判断TIN三角形每条边与水流流向向量的关系将空间三角形分为谷线三角形和非谷线三角形,并分别依据谷线三角形和非谷线三角形提取河网,采用从流域出口回溯的方法计算平坦区域三角形的流向以进一步提取出河道。本发明解决了通过判断TIN三角形每条边的汇水性来识别河道所定义的河道单一的问题以及无法提取平坦区域河道的问题。

Patent Agency Ranking