-
公开(公告)号:CN107016071A
公开(公告)日:2017-08-04
申请号:CN201710178692.2
申请日:2017-03-23
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/2247 , G06F16/81 , G06F16/8365 , G06F16/8373
Abstract: 本发明提出利用简单路径特征优化的树状结构数据处理方法及系统,该方法包括步骤1,设置简单路径,其中所述简单路径为在数据定义的语法树中,从根节点到叶子节点最多只存在一个多值的域的路径;步骤2,通过在扁平行式结构数据中存储所述的简单路径上叶子节点的信息,获取路径上完整的嵌套结构;步骤3,在对列式数据查询过程中,需要将其组装为行式结构数据,通过简单路径的优化可以简化数据中的层次关系:仅通过叶子节点既可表示从根节点到叶子节点的路径而忽略路径中所有的非叶子节点。本发明中通过分析常见的半结构化数据,定义简单路径的概念,利用简单路径对STEED的数据存储、列式数据组装和查询过程进行了优化,提高了相关操作和功能的效率。