基于关键词的RDF分布式语义搜索方法

    公开(公告)号:CN106021457B

    公开(公告)日:2019-10-15

    申请号:CN201610326228.9

    申请日:2016-05-17

    Applicant: 福州大学

    Inventor: 汪璟玢 陈双

    Abstract: 本发明涉及一种基于关键词的RDF分布式语义搜索方法,基于RDF本体构建输入查询关键词的语义可达路径,在构建阶段根据查询内容的语义内容和语义结构进行评分排序,生成Top‑k语义可达路径,然后利用MapReduce计算框架并行搜索返回Top‑k查询结果。本发明所提出的基于关键词的RDF分布式语义搜索方法,基于本体构建搜索语义可达路径确定查询关键词间相互连接路径,避免了直接在大规模RDF数据图上费时的迭代计算,利用MapReduce计算模型实现并行计算,有效地减少了整体计算复杂度来提升查询性能。

    RDF数据分布式并行语义编码方法

    公开(公告)号:CN105930419B

    公开(公告)日:2019-08-09

    申请号:CN201610242787.1

    申请日:2016-04-19

    Applicant: 福州大学

    Inventor: 汪璟玢 郑翠春

    Abstract: 本发明涉及一种RDF数据分布式并行语义编码方法,具体包括以下步骤:步骤S1:读入RDF本体文件,构建类关系模型和属性关系模型;步骤S2:读入RDF数据文件,将三元组分割成三元组项,将三元组项按类划分,并删除重复的三元组项,同时生成前缀编码;对三元组项进行过滤,用以确保RDF三元组编码的一致性,使得同一个三元组项不会分配到不同的编码;步骤S3:将三元组项进行编码,生成字典表;步骤S4:将三元组进行编码,生成编码后的三元组文件;步骤S5:将步骤S4的结果文件作为此步骤的输入,根据步骤S3中的字典表,反转生成原始RDF数据文件。本发明在分布式环境下结合本体能够高效地实现大规模数据的压缩编码与反转。

    结合语义类节点与边权重的关键词搜索KSANEW算法

    公开(公告)号:CN109710621A

    公开(公告)日:2019-05-03

    申请号:CN201910039058.X

    申请日:2019-01-16

    Applicant: 福州大学

    Inventor: 汪璟玢 管健

    Abstract: 本发明涉及一种结合语义类节点与边权重的关键词搜索KSANEW算法。包括:数据存储阶段,该阶段随着知识碎片的到来,动态地更新知识库中语义类、实体和属性等数据;关键词查询阶段,该阶段考虑到知识图谱的模式层相较于数据层数据量小,提出查询种子模型,该模型将查询关键词映射到模式层上,接着通过两类扩展方式,分别是基于节点的大权值方向扩展方式和基于边的大权值方向扩展方式生成候选种子模型,然后通过评分函数对候选种子集合进行评分排序,最后以高评分的候选种子作为查询种子,将查询种子作为指引,在数据层上进行分布式搜索,得到查询结果。

    一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法

    公开(公告)号:CN108509543A

    公开(公告)日:2018-09-07

    申请号:CN201810227329.X

    申请日:2018-03-20

    Applicant: 福州大学

    Inventor: 汪璟玢 于龙

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据多关键词并行搜索方法,首先将输入的关键词映射到RDF本体图上的类顶点或属性边,构建RDF本体类-属性二维模型,通过类之间的关系进行剪枝、去重、连接操作,构建对应的本体查询子图;提出一种相关性评价函数,从结构紧密度和内容关联度两个方面对本体查询子图评分、排序;根据本体查询子图的优先级,评分高的先进行搜索,利用MapReduce计算框架并行搜索RDF数据图上匹配的实例三元组,按本体查询子图连接关系进行连接得到前Top-k的结果。本发明不仅避免了在大量数据图顶点上迭代搜索顶点间连接路径,还提高了查询的精确度,进而提高搜索效率。

    结合Spark平台的OWLHorst规则分布式并行推理算法

    公开(公告)号:CN107016110A

    公开(公告)日:2017-08-04

    申请号:CN201710246308.8

    申请日:2017-04-15

    Applicant: 福州大学

    Inventor: 汪璟玢 叶怡新

    Abstract: 本发明提供一种结合Spark平台的OWLHorst规则分布式并行推理算法:根据Spark RDD的特点,结合TREAT算法的原理,首先对RDF本体数据进行构建模式三元组对应的alpha寄存器Om_RDD或Pt_RDD并广播以及规则标记模型;对每条规则的模式前件进行连接并生成对应的连接模式三元组集合Rulem_linkvar_RDD,从而加快推理过程中的匹配速度;在OWL Horst推理阶段,结合MapReduce实现TREAT算法中的alpha阶段,实现多条规则的分布式并行推理,然后对推理结果进行去重处理;通过alpha寄存器和规则标记模型能够过滤大量实例三元组,减少Map阶段键值对的输出,从而减少了无效的网络传输。

    一种基于Redis的RDF数据分布式存储和查询方法

    公开(公告)号:CN104778277A

    公开(公告)日:2015-07-15

    申请号:CN201510213313.X

    申请日:2015-04-30

    Applicant: 福州大学

    Inventor: 汪璟玢 董书暕

    Abstract: 本发明涉及一种基于Redis的RDF分布式存储和查询方法,所述RDF分布式存储方法采用Type-P数据分配的、基于Redis的RDF分布式存储系统的RDF分布式存储方法;所述RDF分布式查询方法通过判断查询语句复杂程度,选择不同的查询方式,以达到快速有效的查询。本发明所提出的一种基于Redis的RDF分布式存储方法和查询方法,通过将分布式存储系统和优化后的查询方法结合起来,有效的缩小了查询范围,提高了查询效率,并且在查询的元组模式个数较多和语义较复杂时也能高效工作,从而满足了大规模RDF数据的存储与查询的需求。

    一种结合Rete算法的RDF数据分布式并行推理方法

    公开(公告)号:CN104615703A

    公开(公告)日:2015-05-13

    申请号:CN201510047202.6

    申请日:2015-01-30

    Applicant: 福州大学

    Inventor: 汪璟玢 郑翠春

    CPC classification number: G06F17/30864 G06F17/30445

    Abstract: 本发明涉及一种结合Rete算法的RDF数据分布式并行推理方法,在MapReduce算法框架下结合Rete算法并行推理。在结合Rete算法的时候,不是简单的将RDF数据进行分割,而是在Map阶段完成alpha网络的功能,在Reduce阶段完成beta网络的功能。本发明所提出的一种结合Rete算法的RDF数据分布式并行推理方法只需要启动一个MapReduce推理任务就可以完成所有RDFS/OWL规则的一次性推理,通过多次的推理任务迭代实现针对海量RDF数据的高效推理。

Patent Agency Ranking