一种面向医疗数据的差分隐私知识迁移方法及系统

    公开(公告)号:CN115985433A

    公开(公告)日:2023-04-18

    申请号:CN202211296875.1

    申请日:2022-10-21

    Abstract: 本发明涉及差分隐私机器学习技术领域,具体涉及一种面向医疗数据的差分隐私知识迁移方法及系统,方法包括数据拥有者将拥有的隐私医疗数据划分为n份,每份分别采用逻辑回归训练一个医疗诊断分类模型,n个模型组成医疗诊断teacher模型,完成训练的该模型对数据使用者发送的无标签医疗数据进行预测,得到数据的分类结果;将n个模型的投票结果聚合在一起后,在聚合后的投票结果上加上高斯噪声扰动,并将加上扰动后投票数最多的标签发送给数据使用者为无标签数据打上标签;数据使用者利用获得的带标签的数据在本地进行训练,得到student模型;本发明解决了现有技术在医疗中心的强隐私要求下模型准确率低下的问题。

    基于扩散模型和卷积自编码器的电子健康记录生成方法

    公开(公告)号:CN117789904A

    公开(公告)日:2024-03-29

    申请号:CN202311823889.9

    申请日:2023-12-27

    Abstract: 本发明属于文本生成方法,特别涉及一种基于扩散模型和卷积自编码器的电子健康记录生成方法,包括构建自编码网络,利用预训练的自编码网络的编码器对原始医疗数据进行降维处理,得到原始医疗数据的低维表示;构建扩散网络,利用预训练的扩散网络根据与原始医疗数据无关的随机噪声生成新的低维表示;利用自解码网络的解码器根据自编码网络得到的原始医疗数据的低维表示和扩散网络得到的生成的低维向量表示进行重构,得到具有隐私保护的医疗数据;本发明不仅提高了生成数据的多样性和质量,还提高了合成数据的逼真性,防止真实数据的泄露。

    一种面向医疗数据的差分隐私知识迁移方法及系统

    公开(公告)号:CN115985433B

    公开(公告)日:2025-05-06

    申请号:CN202211296875.1

    申请日:2022-10-21

    Abstract: 本发明涉及差分隐私机器学习技术领域,具体涉及一种面向医疗数据的差分隐私知识迁移方法及系统,方法包括数据拥有者将拥有的隐私医疗数据划分为n份,每份分别采用逻辑回归训练一个医疗诊断分类模型,n个模型组成医疗诊断teacher模型,完成训练的该模型对数据使用者发送的无标签医疗数据进行预测,得到数据的分类结果;将n个模型的投票结果聚合在一起后,在聚合后的投票结果上加上高斯噪声扰动,并将加上扰动后投票数最多的标签发送给数据使用者为无标签数据打上标签;数据使用者利用获得的带标签的数据在本地进行训练,得到student模型;本发明解决了现有技术在医疗中心的强隐私要求下模型准确率低下的问题。

Patent Agency Ranking