一种基于超图和动态规划的大数据实时查询优化方法

    公开(公告)号:CN103793467A

    公开(公告)日:2014-05-14

    申请号:CN201310716665.8

    申请日:2013-12-16

    CPC classification number: G06F17/30442

    Abstract: 本发明涉及大数据实时查询技术领域,尤其涉及一种基于超图和动态规划的大数据实时查询优化方法,该方法通过采用基于最佳代价的连接顺序优化方法来提升查询效率,在大数据环境下满足用户的实时查询需求。本发明的有益效果在于:针对执行计划搜索空间过大的问题,构建满足左线性树的搜索策略,大大降低了搜索的空间,提升了基于超图和动态计划算法运行的效率;构建满足大数据环境的最佳代价模型,综合考虑了大数据环境下传输代价及哈希连接算法运行特性等因素,确保了优化方法生成的计划是最佳的。

    一种面向用户信息需求的搜索引擎日志数据挖掘的方法

    公开(公告)号:CN103164537A

    公开(公告)日:2013-06-19

    申请号:CN201310125029.8

    申请日:2013-04-09

    Abstract: 本发明涉及互联网搜索引擎日志划分领域,尤其涉及一种面向用户信息需求的搜索引擎日志数据挖掘的方法,包括:查询日志块归类、查询相似度计算和用户信息需求提供,综合计算查询词相似度和查询结果相似度作为查询相似度,以此为依据判断了两个查询是否具有相同的信息需求,有效快速的对搜索日志进行划分。本发明的有益效果在于:本发明针对传统的搜索引擎质量评价方法不能完整描述用户复杂、模糊信息需求的缺陷,提出了基于行为日志的搜索引擎用户信息需求满意度评估方法,以用户信息需求为单位,通过分析搜索引擎日志中用户的搜索行为来评估用户满意度,分析出用户的个性化需求,并从而促进搜索引擎技术的发展、提高搜索引擎的服务质量。

    一种基于数据仓库内在特征的OLAP关键词查询方法

    公开(公告)号:CN102306176A

    公开(公告)日:2012-01-04

    申请号:CN201110247045.5

    申请日:2011-08-25

    Abstract: 本发明涉及数据仓库搜索技术,尤其涉及一种基于数据仓库内在特征的OLAP关键词查询方法,将可能的查询结果返回给OLAP用户,简化用户多维分析的过程,本发明只对维度表建立索引,这样提高了索引的速度,消除了无关信息的噪音;在索引过程中,通过过滤非相关维度属性来减少无关信息对查询结果的影响,采用过滤重复的维度列的方法规避冗余数据对语义的影响;根据维度层次粒度产生了维度层次权重系数,通过在传统的全文检索排序策略上增加维度层次权重系数来提升命中结果准确度;通过Joins相似的排序评分方法提高了结果排序的准确性,解决了现有技术中存在的问题。

Patent Agency Ranking