基于Spark Streaming的流式RDF数据并行推理算法

    公开(公告)号:CN108763451B

    公开(公告)日:2022-03-11

    申请号:CN201810521793.X

    申请日:2018-05-28

    Applicant: 福州大学

    Inventor: 汪璟玢 陈晓曦

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据并行推理算法。首先结合OWL Horst推理规则,构建相应的规则连接变量关系表;在迭代并行推理阶段定时获取Streaming数据流中的批量新数据以及前次推理产生的数据作为输入数据,对输入的模式数据和实例数据进行归类处理并存储到相应的Redis集群;然后,根据规则连接变量关系表,判断本次推理能够激活的规则,结合相应的实例数据产生推理数据;最后,删除本次推理产生的重复数据并存储,本次迭代推理结束。本发明减少了MapReduce的任务数,结合Spark进行流式数据的迭代推理;设计规则连接变量关系表来存储数据以及推理中产生的新数据,保证了算法的完备性;设计了实例三元组的存储方案,结合Redis的特性,以空间换时间,实现了实例数据的快速读取。

    一种扩展DL算子的复杂规则推理设计方法

    公开(公告)号:CN108875953A

    公开(公告)日:2018-11-23

    申请号:CN201810583866.8

    申请日:2018-06-08

    Applicant: 福州大学

    Inventor: 汪璟玢 陈晓曦

    Abstract: 本发明涉及一种扩展DL算子的复杂规则推理设计方法,在迭代并行推理阶段定时获取Streaming数据流中的新数据,以及前次推理产生的新三元组数据作为本次迭代的输入数据,对输入的模式数据和实例数据进行归类处理并存储到相应的Redis集群;然后,根据复杂规则连接变量关系表,对衍生规则进行匹配推理并保存推理结果到Redis集群中。最后,读取Redis集群中衍生规则的推理结果,得出满足条件的实例并输出,本次迭代推理结束。本发明使得本体语言在清晰地表达复杂的集合概念基础上,完成复杂的条件推理。

    基于Spark Streaming的流式RDF数据并行推理算法

    公开(公告)号:CN108763451A

    公开(公告)日:2018-11-06

    申请号:CN201810521793.X

    申请日:2018-05-28

    Applicant: 福州大学

    Inventor: 汪璟玢 陈晓曦

    CPC classification number: G06N5/046

    Abstract: 本发明涉及一种基于Spark Streaming的流式RDF数据并行推理算法。首先结合OWL Horst推理规则,构建相应的规则连接变量关系表;在迭代并行推理阶段定时获取Streaming数据流中的批量新数据以及前次推理产生的数据作为输入数据,对输入的模式数据和实例数据进行归类处理并存储到相应的Redis集群;然后,根据规则连接变量关系表,判断本次推理能够激活的规则,结合相应的实例数据产生推理数据;最后,删除本次推理产生的重复数据并存储,本次迭代推理结束。本发明减少了MapReduce的任务数,结合Spark进行流式数据的迭代推理;设计规则连接变量关系表来存储数据以及推理中产生的新数据,保证了算法的完备性;设计了实例三元组的存储方案,结合Redis的特性,以空间换时间,实现了实例数据的快速读取。

Patent Agency Ranking