一种具有隐私保护的K-means聚类方法及系统

    公开(公告)号:CN107145791B

    公开(公告)日:2020-07-10

    申请号:CN201710224275.7

    申请日:2017-04-07

    Abstract: 本发明提供一种具有隐私保护的K‑means聚类方法及系统,属于数据挖掘技术领域。本发明包括如下步骤:数据拥有者A和B加密各自的数据和随机选择的质心点,上传至服务器;服务器通过安全乘法协议和安全距离计算协议在密文数据中计算数据点到质心点的欧氏距离,并将数据点归类;服务器、数据拥有者A和B通过安全电路协议共同在密文数据中重新计算新的质心点;数据拥有者A或B通过安全比较协议判断新的质心点与原质心点的距离,如果小于阈值,结束分类,数据拥有者A和B请求服务器将分类好的数据分别发送给数据拥有者A和B,否则,重新上传新的质心点,进行下一轮迭代。本发明在保证数据隐私安全的同时保证了数据挖掘结果的正确性;支持数据存储外包和数据计算外包,在保证正确性的同时,执行效率也大幅度提升;支持三个参与方中最多一方为恶意方的安全计算。

    基于数字图像转化和深度学习的数字取证文件碎片分类方法

    公开(公告)号:CN108694414A

    公开(公告)日:2018-10-23

    申请号:CN201810455121.3

    申请日:2018-05-11

    CPC classification number: G06K9/6268 G06N3/0454

    Abstract: 本发明提供了一种基于数字图像转化和深度学习的数字取证文件碎片分类方法,先将文件碎片转换为灰度图像,然后利用深度学习提取图像的更多隐藏特征,以提高文件碎片分类的性能;其中,所述更多隐藏特征包括:不同的纹理特征,随机特征和用于分类的可压缩性;所述深度学习采用修改和优化的CNN模型,所述模型的第一层卷积层使用1x1比例的卷积核,它使用许多管道使网络结构复杂化;由于每个层中都有不同数量和尺度的滤波核,通过梯度下降和逆向训练来训练最佳匹配本分类模型特征图。本发明通过利用CNN的局部连接和权重共享的优点,提取文件碎片的高维特征,该方案对于以前方案中不易分类的文件,如复合文件和压缩文件,也能实现高精度的碎片分类。

    基于密文数据的多用户隐私保护数据聚类方法及系统

    公开(公告)号:CN107145792B

    公开(公告)日:2020-09-15

    申请号:CN201710225047.1

    申请日:2017-04-07

    Abstract: 本发明提供一种基于密文数据的多用户隐私保护数据聚类方法及系统,属于数据挖掘技术领域。本发明方法包括步骤:两个以上用户发送各自加密后的数据和聚类中心点、陷门信息给服务器;服务器计算密文数据点和聚类中心点的距离,并划分聚类;服务器将每个聚类中不同的用户的数据点分别进行相加,并将数据的总和及个数分别发送给用户;用户将收到的数据总和及个数重新加密后发送给服务器;服务器计算新的聚类中心点,并将新的聚类中心点发送给各个用户;各个用户通过外包隐私保护平均数计算协议共同计算每个聚类中数据点距离聚类中心点的平均值,然后发送给服务器,进行下次迭代。本发明大大提高了聚类效率;实现半诚实模型下的安全计算,同时可以抵抗一定程度上的合谋攻击。

Patent Agency Ranking