-
公开(公告)号:CN115982754A
公开(公告)日:2023-04-18
申请号:CN202211543557.0
申请日:2022-12-03
Applicant: 桂林理工大学
Abstract: 本发明公开了一种用于深度学习中支持多方联合训练的数据隐私保护方法,属于深度学习隐私保护技术领域。本发明基于不可逆变换技术的处理方式,采用将初始模型拆分为本地用户模型与中心服务器模型,并通过在本地模型中添加随机节点的方式使得本地训练过程不可逆。同时通过计算各数据集各类数据中各特征属性的可信度来降低低质量数据对于整体模型预测精度的影响。本发明可以有效的防止低质量数据参与训练对模型结果的破坏并能有效的保护各参与方数据集的隐私。与现有技术相比,消耗的计算资源与通信资源都较少。
-
公开(公告)号:CN114998971B
公开(公告)日:2024-11-22
申请号:CN202210743072.X
申请日:2022-06-27
Applicant: 桂林理工大学
IPC: G06V40/16 , G06N3/0464 , G06N3/084 , G06V10/25 , G06V10/774 , G06V10/82
Abstract: 本发明涉及深度学习隐私保护技术领域,具体涉及一种人脸识别的混合扰动差分隐私保护方法,包括抓取人脸数据;对所述人脸数据进行预处理,得到最小检测框;对所述最小检测框进行人脸重定位,得到训练数据;基于所述训练数据构建混合扰动差分隐私模型;改变三元组损失函数,使得所述混合扰动差分隐私模型通过所述训练数据训练后,得到混合扰动的神经元结点权重。所述混合扰动差分隐私模型将神经网络权重分割为网络权重和噪声权重,使得网络权重能够尽力去为神经网络提供学习能力,而噪声权重利用目标扰动又尽力去为网络权重提供隐私保护,解决了现有的隐私保护方法的深度神经网络的可用性较差的问题。
-
公开(公告)号:CN114580010A
公开(公告)日:2022-06-03
申请号:CN202210063642.0
申请日:2022-01-20
Applicant: 桂林理工大学
IPC: G06F21/62
Abstract: 本发明涉及数据匿名技术领域,具体涉及一种基于敏感分级信息熵的匿名方法,包括获取发布数据集;基于发布数据集建立匿名模型;基于发布数据集的信息熵建立信息损失衡量标准模型;基于信息损失衡量标准模型对发布数据集进行遍历,得到隐私安全指数最大的最大元组,将最大元组加入匿名模型中对应的等价组;使用等价组的准标识属性中心替代最大元组的值,得到匿名数据集,通过引入信息熵建立的信息损失衡量标准模型与匿名模型对发布数据集进行处理,得到的所述匿名数据的信息熵最高,即数据可用性最高,解决了现有的匿名方法对数据匿名后的数据可用性较低的问题。
-
公开(公告)号:CN114564575A
公开(公告)日:2022-05-31
申请号:CN202210058001.6
申请日:2022-01-19
Applicant: 桂林理工大学
Abstract: 本发明涉及人工智能技术领域,具体涉及一种基于倾斜随机森林的处理大量文本中识别不良文本的方法,包括读取文本数据;对文本数据进行预处理,得到文本向量;建立不良文本词典对所述文本向量进行不良率判断,若判断不合格则将所述文本向量定义为不良文本;若判断合格则得到文本集合并执行下一步;基于文本集合,利用随机森林构建倾斜随机森林分类模型;利用倾斜随机森林分类模型对文本向量进行分类,得到文本分类结果,通过倾斜随机森林分类模型得出的分类结果准确率较高,解决了传统的随机森林算法分类的准确率较低的问题。
-
公开(公告)号:CN116228906A
公开(公告)日:2023-06-06
申请号:CN202310100403.2
申请日:2023-02-12
Applicant: 桂林理工大学
IPC: G06T11/00 , G06T5/00 , G06F21/71 , G06N3/048 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/088
Abstract: 本发明提供了一种基于差分隐私的生成对抗网络图像生成系统,属于人工智能和隐私保护领域,所述系统包括:生成对抗网络由生成器和判别器组成,生成器用于捕获数据分布,产生图像数据;判别器用于估计样本是否来自训练数据,以判断生成数据是否接近真实分布;在需要用到原始数据的判别器损失函数上添加双向选择的噪声,损失函数由两个向量构成,在一个向量的某一个位置上添加了噪声时,另一个向量的对应位置就无需添加噪声,反之亦然,以满足差分隐私;对每一批输入的样本,判别器和生成器交叉训练和迭代,生成预期数量的图像数据。本发明基于差分隐私的生成对抗网络图像生成系统可以保护原始数在据训练过程中的隐私,同时提高生成图像的可用性。
-
公开(公告)号:CN116127513A
公开(公告)日:2023-05-16
申请号:CN202310098531.8
申请日:2023-02-10
Applicant: 桂林理工大学
Abstract: 本发明公开了一种基于线性变换的多数据集协作训练隐私方法,属于深度学习隐私保护技术领域。本发明基于线性变换技术采用向各参与者的线性变换矩阵添加噪声的方式保护各参与者训练数据隐私。同时使用优化算法迭代出满足参与者隐私需求条件下的最优噪声指数,该噪声指数使得经过线性变换后的训练数据的模型准确率与隐私保护度的加权和最大,使得模型能够平衡模型的准确性与隐私保护力度。与现有技术相比本发明平衡了数据隐私保护程度与模型准确率,同时考虑到各参与者对数据的不同程度的隐私需求。
-
公开(公告)号:CN115983316A
公开(公告)日:2023-04-18
申请号:CN202310002235.3
申请日:2023-01-03
Applicant: 桂林理工大学
Abstract: 本发明涉及隐私保护技术领域,具体涉及一种基于鸟群优化的深度学习模型隐私保护方法,包括首先进行数据集蒸馏,将精炼后的数据集作为模型训练的输入数据集;将鸟群参数初始化,用鸟的位置表示各神经元的权重参数;在每一次的迭代中,利用鸟的位置参数计算当前梯度,对所得梯度进行剪裁;对每个样本梯度添加噪声,梯度下降,参数更新;根据适应度,更新个体历史最优位置和当下种群最优鸟的位置,重新进行新一轮的迭代训练;达到停止条件时,迭代结束,得到一个满足差分隐私的网络和扰动后的最优参数。经验证,本发明在收敛速度、最终收敛程度和测试效果上均优于基准方法,在保护用户隐私的同时,更好地保留了模型的准确性。
-
公开(公告)号:CN119379722A
公开(公告)日:2025-01-28
申请号:CN202411404192.2
申请日:2024-10-09
Applicant: 桂林理工大学
Abstract: 本发明提供了一种融合Transformer和残差网络的医学图像分割方法,属于医学图像分割领域。首先,进行数据增强,以扩大训练集;增强后的数据集作为模型训练的输入,分别输入到并行的Transformer分支和残差网络分支,以提取图像的全局语义特征和局部细节特征;各分支的跳跃连接处采用深度残差注意力模块,帮助预测目标边界;解码阶段采用逐步上采样特征融合方式,减少语义差异、特征信息丢失;最后,将两分支输出的全尺寸张量进行通道拼接,使用高效预测头融合拼接的张量,得到分割图。经验证,本方法的性能优于许多现有的主流方法,能有效的改善现有方法在医学图像分割中出现的对人体器官、组织或病灶的复杂目标区域分割困难、边缘细节信息丢失、泛化能力不足等问题。
-
公开(公告)号:CN116110415A
公开(公告)日:2023-05-12
申请号:CN202211644919.5
申请日:2022-12-20
Applicant: 桂林理工大学
Abstract: 本发明公开了一种基于BERT的非平行语料下的语音转换方法,属于语音信号处理技术领域。在模型训练过程中,首先由音频特征算法从音素语料库提取语音特征,将特征导入到音素识别模块进行训练;接着对目标语音进行音频特征提取,然后导入到音素识别模型得到目标语音的音素特征;最后将音素特征和目标语音特征导入到特征转换模型,共同完成语音特征转换训练。在语音转换过程中,利用特征算法对源语音进行特征提取,然后输出到音素识别模块得到其音素特征,再将其输出到特征转换模块即可实现语音特征转换,最后进入语音合成模块获得转换后的语音。本方法将音素提取及特征转换应用在BERT模型中,运算简洁,为非平行语料转换提供技术支撑。
-
公开(公告)号:CN116013356A
公开(公告)日:2023-04-25
申请号:CN202211728723.4
申请日:2022-12-30
Applicant: 桂林理工大学
Abstract: 本发明涉及语音信号处理技术领域,具体涉及一种基于不同说话人的语音内容过滤方法,采用轻量化结构的声纹网络进行声纹注册,再将需要查询的声纹特征输入进行识别输出结果。首先,根据不同的预存说话人信息,构造专属敏感词袋。采用声纹识别判断使用者的具体身份,实现个性化过滤。其次,通过语音识别技术,获取说话内容信息,比对敏感词进行过滤。最后,将剔除相关内容的文字通过合成技术完成输出。进一步的,本发明采用轻量级网络结构,减少在移动端等部署器的开销。
-
-
-
-
-
-
-
-
-