-
公开(公告)号:CN107992608A
公开(公告)日:2018-05-04
申请号:CN201711344360.3
申请日:2017-12-15
Applicant: 南开大学
IPC: G06F17/30
Abstract: 一种基于关键字上下文的SPARQL查询语句自动生成方法,属于数据库技术应用领域。包括:采用RDF数据到标签图的映射方法,基于实体类型和实体之间关系对RDF标签图进行模式摘要处理;构建包含节点在RDF标签图中位置信息的两层关键字索引;利用关键字索引将用户输入的关键字映射至RDF标签图中节点,采用后向搜索算法在RDF模式图中寻找包含关键字的子图;最后基于子图与用户查询意图的相关度对结果进行计分排序,将得分较高的结果转化为SPARQL查询语句。本发明提出的SPARQL查询语句自动生成方法,能够根据关键字准p确、高效地生成符合用户查询意图的SPARQL查询语句,达到帮助用户快速查询信息的目的。
-
公开(公告)号:CN104036051B
公开(公告)日:2017-04-05
申请号:CN201410317326.7
申请日:2014-07-04
Applicant: 南开大学
IPC: G06F17/30
Abstract: 本发明公布了一种基于标签传播的数据库模式摘要生成方法,属于数据库技术应用领域。本发明方法的基本步骤如下:首先采用数据库模式到标签图的映射方法,通过关系表中的主外键信息、属性信息以及元组信息衡量每张关系表重要度。其次采用多元线性回归模型计算关系表相似度,选取名称、属性值以及关系表之间的映射关系作为相似度模型的主要特征。最后采用半监督的标签传播算法对模式信息聚类,自动生成模式摘要。本发明提出的数据库模式摘要生成方法,能够为大规模数据库模式摘要的自动生成提供一种有效的解决方案,达到帮助用户快速理解数据库模式信息的目的。
-
公开(公告)号:CN103853844A
公开(公告)日:2014-06-11
申请号:CN201410110441.7
申请日:2014-03-24
Applicant: 南开大学
IPC: G06F17/30
CPC classification number: G06F17/30595 , G06F17/30289 , G06F17/30321
Abstract: 基于Hadoop的关系表非冗余键集合识别方法。包括:提出了一种基于数据修剪和属性修剪的键集合识别算法,并设计出了该算法的分布式解决方案MRKeyFinder。本发明提出的非冗余键集合识别算法,能够为大规模数据集中非冗余键集合信息识别提供一种有效的解决方案。本发明可用于数据建模、数据集成、异常检测、查询优化、建立索引等领域。
-
公开(公告)号:CN101807211A
公开(公告)日:2010-08-18
申请号:CN201010160331.3
申请日:2010-04-30
Applicant: 南开大学
IPC: G06F17/30
Abstract: 一种面向海量小规模XML文档融合路径约束的XML检索方法。包括:创新地以带有XPath形式路径约束的关键字作为用户提交查询的方式,使用户更加容易且准确地表达查询需求;提出一种新的融合路径约束的检索排序模型,该模型在传统向量空间模型基础上,充分利用XML文档的结构层次特性,巧妙地将N-Gram思想应用于路径约束匹配计算,从而获得文档同用户查询的相关度,最终按照相关度对文档进行排序。本发明提出的XML文档检索方案,能够准确地表达用户的查询需求,且充分利用XML文档的路径约束来计算文档同用户查询的相关度,通过本发明方案可得到更加符合用户需求的检索结果。本发明可用于XML文档检索、XML数据库检索等领域。
-
-
-