-
公开(公告)号:CN109558424B
公开(公告)日:2023-04-18
申请号:CN201811304324.9
申请日:2018-11-03
Applicant: 复旦大学
IPC: G06F16/2455 , G06F18/241 , G06F18/23
Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。
-
公开(公告)号:CN110309671B
公开(公告)日:2022-12-20
申请号:CN201910558380.3
申请日:2019-06-26
Applicant: 复旦大学
Abstract: 本发明属于隐私保护技术领域,具体为一种基于随机应答技术的通用数据发布隐私保护方法。本发明基于随机应答技术,利用矩阵分解方法与克罗内克积性质,将重构无偏估计结果的计算复杂度从指数级增长降为线性增长,实现无偏估计结果的误差最小化,并允许为每个属性单独设置隐私保护参数,有效提高计算效率、数据可用性和应用灵活性。本发明方法支持单敏感属性和多敏感属性的数据发布,所述敏感属性包括布尔型属性、分类型属性和数值型属性;本发明能够为医疗、金融、生物信息和交通等领域的科研与管理提供高效、灵活的数据发布隐私保护机制,有助于在数据发布过程中保护数据隐私的同时,保留发布数据有用信息,促进数据的共享共用。
-
公开(公告)号:CN109543445B
公开(公告)日:2022-12-20
申请号:CN201811265074.2
申请日:2018-10-29
Applicant: 复旦大学
IPC: G06F21/62
Abstract: 本发明属于信息安全隐私保护技术领域,是一种基于条件概率分布的隐私保护数据发布方法。根据条件概率分布对攻击者的先验知识进行建模,让攻击者在不同事务中具有不同的先验知识;然后利用构建的模型和准标识符属性值,对每条记录的敏感属性值进行预测,并用预测值替换原始值后进行发布。发布的敏感属性预测值与原始值没有直接相关性,有效保护了用户数据隐私;预测的敏感属性值分布与真实的分布近似,有效控制了分布误差,确保其发布数据集比泛化及随机应答方法发布的数据集可用性更好。本发明能为医疗、金融、生信、交通等各个社会领域的数据发布提供隐私保护机制,在保护用户数据隐私的同时,为数据在科学研究和社会服务中的应用提供支撑。
-
公开(公告)号:CN110309671A
公开(公告)日:2019-10-08
申请号:CN201910558380.3
申请日:2019-06-26
Applicant: 复旦大学
Abstract: 本发明属于隐私保护技术领域,具体为一种基于随机应答技术的通用数据发布隐私保护方法。本发明基于随机应答技术,利用矩阵分解方法与克罗内克积性质,将重构无偏估计结果的计算复杂度从指数级增长降为线性增长,实现无偏估计结果的误差最小化,并允许为每个属性单独设置隐私保护参数,有效提高计算效率、数据可用性和应用灵活性。本发明方法支持单敏感属性和多敏感属性的数据发布,所述敏感属性包括布尔型属性、分类型属性和数值型属性;本发明能够为医疗、金融、生物信息和交通等领域的科研与管理提供高效、灵活的数据发布隐私保护机制,有助于在数据发布过程中保护数据隐私的同时,保留发布数据有用信息,促进数据的共享共用。
-
公开(公告)号:CN109543445A
公开(公告)日:2019-03-29
申请号:CN201811265074.2
申请日:2018-10-29
Applicant: 复旦大学
IPC: G06F21/62
Abstract: 本发明属于信息安全隐私保护技术领域,是一种基于条件概率分布的隐私保护数据发布方法。根据条件概率分布对攻击者的先验知识进行建模,让攻击者在不同事务中具有不同的先验知识;然后利用构建的模型和准标识符属性值,对每条记录的敏感属性值进行预测,并用预测值替换原始值后进行发布。发布的敏感属性预测值与原始值没有直接相关性,有效保护了用户数据隐私;预测的敏感属性值分布与真实的分布近似,有效控制了分布误差,确保其发布数据集比泛化及随机应答方法发布的数据集可用性更好。本发明能为医疗、金融、生信、交通等各个社会领域的数据发布提供隐私保护机制,在保护用户数据隐私的同时,为数据在科学研究和社会服务中的应用提供支撑。
-
公开(公告)号:CN107547525B
公开(公告)日:2020-07-07
申请号:CN201710689147.X
申请日:2017-08-14
Applicant: 复旦大学
IPC: H04L29/06 , G06F21/62 , G06F16/2457
Abstract: 本发明属于大数据技术领域,具体为一种大数据查询处理的隐私保护方法。本发明方法基于半可信模型,分为初始化和查询处理两大部分。本发明能够同时保护数据隐私、查询隐私和存储隐私,具体包括数据拥有者的数据隐私和存储隐私、数据使用者(即查询者)的查询隐私和服务提供者的存储隐私,突破了现有隐私保护技术仅能保护其中一种或两种隐私的局限性,适用于不同应用领域的开放互联信息网络环境下的分布式大数据查询处理。本发明能够为医疗、金融、生物信息和交通等领域的大数据分布式数据共享提供隐私保护机制,将有助于打破现有云计算及大数据的发展瓶颈,推进整个社会信息化服务的变革。
-
公开(公告)号:CN109558424A
公开(公告)日:2019-04-02
申请号:CN201811304324.9
申请日:2018-11-03
Applicant: 复旦大学
IPC: G06F16/2455 , G06K9/62
CPC classification number: G06K9/6268 , G06K9/6218
Abstract: 本发明属于数据挖掘技术领域,具体是一种高效的流数据模式挖掘方法。本发明采用最小化验证误差模型来作为聚类划分标准,分两步找出流数据中的隐藏模型。第一步为序列聚类,即:基于增强动态规划方法,找出将数据流划分为多个连续数据段的最优划分;第二步为迭代聚类,即:基于期望最大化方法的工作原理和最优划分的数据段特征,对数据段进行迭代聚类,进而找出流数据中的隐藏模型。实验结果表明,本发明能够对流数据进行有效划分与聚类,错误率较低,且运行时间与数据集大小和数据段多少呈线性相关,效率较高。
-
公开(公告)号:CN107547525A
公开(公告)日:2018-01-05
申请号:CN201710689147.X
申请日:2017-08-14
Applicant: 复旦大学
Abstract: 本发明属于大数据技术领域,具体为一种大数据查询处理的隐私保护方法。本发明方法基于半可信模型,分为初始化和查询处理两大部分。本发明能够同时保护数据隐私、查询隐私和存储隐私,具体包括数据拥有者的数据隐私和存储隐私、数据使用者(即查询者)的查询隐私和服务提供者的存储隐私,突破了现有隐私保护技术仅能保护其中一种或两种隐私的局限性,适用于不同应用领域的开放互联信息网络环境下的分布式大数据查询处理。本发明能够为医疗、金融、生物信息和交通等领域的大数据分布式数据共享提供隐私保护机制,将有助于打破现有云计算及大数据的发展瓶颈,推进整个社会信息化服务的变革。
-
-
-
-
-
-
-