-
公开(公告)号:CN107291935B
公开(公告)日:2020-09-29
申请号:CN201710536073.6
申请日:2017-07-04
Applicant: 东北大学
IPC: G06F16/22 , G06F16/2453 , G06F21/62
Abstract: 本发明公开了一种基于Spark与Huffman编码的CPIR‑V最近邻隐私保护查询方法,将最近邻矩阵的数据使用Huffman编码进行压缩减少每个网格中的数据Bit位数;然后将压缩的数据,字符的码长以及元素最大值存储到空数据库HBase中;接着服务器端读取读取HBase数据库中的数据并缓存到Spark并行框架的RDD中,并根据并行策略对RDD中的CPIR最近邻矩阵进行分组,分组后Spark服务端根据查询信息进行CPIR并行计算,将每个分组的计算结果聚合然后将查询结果和字符码长发送给客户端;客户端将查询结果解析获得查询位的值,将查询位的值解压,得到查询信息。本发明基于Spark并行化和Huffman编码的隐私保护查询算法,保证在大数据应用场景下,保护用户的查询隐私并在原有的查询效果下提高查询效率。
-
公开(公告)号:CN107291935A
公开(公告)日:2017-10-24
申请号:CN201710536073.6
申请日:2017-07-04
Applicant: 东北大学
Abstract: 本发明公开了一种基于Spark与Huffman编码的CPIR-V最近邻隐私保护查询方法,将最近邻矩阵的数据使用Huffman编码进行压缩减少每个网格中的数据Bit位数;然后将压缩的数据,字符的码长以及元素最大值存储到空数据库HBase中;接着服务器端读取读取HBase数据库中的数据并缓存到Spark并行框架的RDD中,并根据并行策略对RDD中的CPIR最近邻矩阵进行分组,分组后Spark服务端根据查询信息进行CPIR并行计算,将每个分组的计算结果聚合然后将查询结果和字符码长发送给客户端;客户端将查询结果解析获得查询位的值,将查询位的值解压,得到查询信息。本发明基于Spark并行化和Huffman编码的隐私保护查询算法,保证在大数据应用场景下,保护用户的查询隐私并在原有的查询效果下提高查询效率。
-