一种外包空间数据库中反最远邻居验证方法

    公开(公告)号:CN106970983A

    公开(公告)日:2017-07-21

    申请号:CN201710196480.7

    申请日:2017-03-29

    Applicant: 东北大学

    Abstract: 本发明公开一种适用于外包空间数据库中反最远邻居验证方法,基于位置服务和时空数据管理领域,保证客户端接受反最远邻居结果集的正确性,整体处理分为第三方服务器处理和客户端验证两个部分。基于MR‑Tree索引结构,提出缩减验证对象的优化算法来降低通信和客户端验证等代价。服务器响应请求的步骤:判断请求是否有效;针对有效查询利用半平面修剪技术生成Influenced Zone;采用范围查询验证思想,形成结果集和其VO;发送结果集、VO和Influenced Zone给客户端。客户端验证步骤:利用VO判断数据是否可靠;通过Influenced Zone筛选数据后与结果集比较;若一致,则验证成功,客户端接受该结果集。本发明的算法应用于海量数据中基于位置服务的RkFN查询验证,效率较高,应用范围广泛。

    一种并行环境下的有向图可达性链表生成及查询方法

    公开(公告)号:CN103399902A

    公开(公告)日:2013-11-20

    申请号:CN201310317126.7

    申请日:2013-07-23

    Applicant: 东北大学

    Abstract: 一种并行环境下的有向图可达性链表生成及查询方法,属于大图数据处理领域。将一个有向图分发到各个处理机中,每个处理机存储图中的节点及节点所对应的子节点;将分割到各个处理机内的图数据压缩;计算主干图上主干节点可达性编码;构建链式索引;在链式索引上建立跳表;各处理机间进行数据通信:各处理机向其他处理机发送跳表信息;各处理机更新自身的跳表信息;建立全图可达性索引。本发明通并行环境下的图可达性压缩技术,极大降低图数据大小、降低系统计算负载,使得系统处理更大规模的图数据。本发明提高从磁盘上读取数据的速度,间接加快查询速度,保证查询结果准确性,极大降低并行计算系统在查询时的网路通信代价和查询时间。

    一种基于实体的自底向上Web数据抽取方法

    公开(公告)号:CN102262658B

    公开(公告)日:2013-10-16

    申请号:CN201110196449.6

    申请日:2011-07-13

    Applicant: 东北大学

    Abstract: 本发明提供了一种基于实体的自底向上Web数据抽取方法,属于网络数据管理领域,具体步骤包括:选择Web数据页面、划分文本、标注实体属性、抽取属性序列重复模式抽取、化简结果模式;本发明的Web数据抽取方法,可以更广泛的抽取复杂Web页面的结构化数据,有效避免先前抽取技术对页面结构的过度依赖,适应性好,准确度高。

    组合式大屏幕流媒体播放的计算机控制方法

    公开(公告)号:CN101901126B

    公开(公告)日:2012-01-04

    申请号:CN201010224036.X

    申请日:2010-07-12

    Applicant: 东北大学

    Abstract: 组合式大屏幕流媒体播放的计算机控制方法,属于组合式大屏幕的显示控制领域,采用屏幕比较传输的方式,即选取每一帧图像中的若干像素点作为采样点,将这些点分别与前一帧中的对应点比较:若不同,认为该点周围区域内的图像已发生改变,将该区域内的图像传至目的主机;若相同,认为该点周围区域图像没有变化,不进行传输;通过比较传输,当图像与上一帧相比变化不大时,可大大减少传输的数据量,本发明方法的另一个优点是价格低廉且通用性更强。

    一种DeepWeb响应页面数据抽取方法

    公开(公告)号:CN101582074B

    公开(公告)日:2011-01-26

    申请号:CN200910010201.9

    申请日:2009-01-21

    Applicant: 东北大学

    Abstract: 一种DeepWeb响应页面数据抽取方法,属于深层网络数据管理领域,该方法包括以下步骤:(1)选取DeepWeb响应页面Page;在查询页面输入关键字Key,查询得到响应页面Page;(2)抽取页面模板信息;对于响应页面的DOM树结构,找到包含关键字的孩子结点个数Wn最多的双亲结点P,将带标记的token块序列转化为带标记的token字符序列;用LCS算法处理以上两个记录的带标记的token字符序列,分隔并过滤公共token字符序列得到模板信息;(3)数据抽取;(4)token块合并;(5)数据表格聚类;本发明的有益效果:采用本发明的数据抽取方法,适用性强,精度高,效率得到大大提高。

    一种Web环境下的字符串相似度的分析方法

    公开(公告)号:CN101561813B

    公开(公告)日:2010-09-29

    申请号:CN200910011738.7

    申请日:2009-05-27

    Applicant: 东北大学

    Abstract: 一种Web环境下的字符串相似度分析方法,首先定义基本操作代价;对字符串预处理,识别它的词首字符和去除非实意字符;创建距离矩阵,通过创建匹配索引实现编辑距离的优化;然后,判断缩写词,先判断两个字符串是否是缩写关系,如果是缩写关系则进行距离优化;其中,缩写关系由2个因素决定:①判断两者是否有相似度;②判断两者的词首字符是否被匹配;之后对缩写词距离优化,通过减少连续插入字符和连续删除字符的代价实现。本发明的字符串相似度分析方法能很好地处理web中经常出现的省略、缩写和字符顺序颠倒情况,具有较高适用性,在Web未知环境下,具有较高的匹配精度。

Patent Agency Ranking