-
公开(公告)号:CN119475331A
公开(公告)日:2025-02-18
申请号:CN202411415976.5
申请日:2024-10-11
Applicant: 浙江大学
IPC: G06F21/56 , G06F18/214 , G06F18/2431 , G06F18/27 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种无辅助数据依赖的鲁棒后门防御方法和系统,属于深度学习模型安全和人工智能防御技术领域。本发明通过对抗扰动分析后门注入与样本污染之间的内在关系,从有毒数据集中初步隔离干净样本和污染样本;在选定的干净样本上进行反向学习和重新学习,训练得到增强中毒模型;通过增强中毒模型精确识别污染样本和干净样本,并基于干净样本进行模型训练,最终获得无后门的鲁棒模型,最后对污染样本重新标注并用于无后门的鲁棒模型的微调,进一步提升模型的鲁棒性。本发明不依赖任何辅助干净数据集,并能有效抵御多种后门攻击,同时保持模型的高精度。本发明填补了现有技术在无辅助数据条件下进行鲁棒后门防御模型训练的空缺。
-
公开(公告)号:CN116383047A
公开(公告)日:2023-07-04
申请号:CN202310312188.2
申请日:2023-03-28
Applicant: 浙江大学
IPC: G06F11/36
Abstract: 本发明公开了一种代码提交场景下的全局关联定向模糊测试方法和系统。方法包括:对待测程序海量代码提交中的功能无关提交过滤,得到待测提交,并利用函数内支配树筛选待测目标位置;对待测提交源码进行静态分析,提取控制流、数据流等基本块关联信息,并基于基本块间边数计算各基本块与目标位置间距离;在测试用例执行过程中,收集和统计执行信息,并基于关联基本块执行情况为测试用例分配能量;按照测试用例有无执行到目标位置进行分类讨论并设计掩码加入变异策略生成新测试用例,提升高价值字节的利用率;重复以上步骤直至模糊测试结束。本发明的方法使得定向模糊测试挖掘软件新生漏洞的效率大幅度提升。
-
公开(公告)号:CN116070277A
公开(公告)日:2023-05-05
申请号:CN202310210011.1
申请日:2023-03-07
Applicant: 浙江大学
Abstract: 本发明公开了一种基于深度哈希的纵向联邦学习隐私保护方法和系统,属于分布式机器学习安全技术领域。通过各合作方本地模型获取样本的抽象表示,通过归一化层得到零均值连续码,利用哈希层对连续码进行二值化后得到哈希码;各参与方将哈希码上传服务器端,服务器端聚合各方哈希码,通过顶层模型计算预测值,依据预测值和标签计算分类损失、利用预生成的二值码计算各参与方哈希码间的余弦相似度损失,通过上述损失计算梯度,更新顶层模型,并向各合作方分发各自梯度,梯度在本地哈希层传播时保持不变。本发明利用深度哈希技术,能够在保障用户数据安全的前提下,既不损失模型性能,又极大程度地提高了计算效率,不存在模型被攻击者逆向重构的风险。
-
公开(公告)号:CN114625924B
公开(公告)日:2022-08-26
申请号:CN202210529260.2
申请日:2022-05-16
Applicant: 浙江大学
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于多视觉专家知识蒸馏的侵权视频检索方法及系统,属于侵权视频检索技术领域。该方法包括:首先通过预训练的视觉模型获取视频的初始特征,然后通过在目标数据集上对视频的初始特征进行编码训练,得到具有更强任务适应性的视频特征表示。接着设计知识融合方法将多种基础检索模型的知识进行融合,融合后的知识通过知识蒸馏的方式迁移到蒸馏检索模型中。最终得到的融合了多位专家知识的蒸馏检索模型具有更高的计算效率和更加优越的性能。本发明利用深度学习技术和知识蒸馏技术,能够实现高效鲁棒的侵权视频检索,在很大程度上提高了侵权视频检索的性能和效率。
-
公开(公告)号:CN114625924A
公开(公告)日:2022-06-14
申请号:CN202210529260.2
申请日:2022-05-16
Applicant: 浙江大学
IPC: G06F16/783 , G06F16/71 , G06V20/40 , G06V10/74 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明公开了一种基于多视觉专家知识蒸馏的侵权视频检索方法及系统,属于侵权视频检索技术领域。该方法包括:首先通过预训练的视觉模型获取视频的初始特征,然后通过在目标数据集上对视频的初始特征进行编码训练,得到具有更强任务适应性的视频特征表示。接着设计知识融合方法将多种基础检索模型的知识进行融合,融合后的知识通过知识蒸馏的方式迁移到蒸馏检索模型中。最终得到的融合了多位专家知识的蒸馏检索模型具有更高的计算效率和更加优越的性能。本发明利用深度学习技术和知识蒸馏技术,能够实现高效鲁棒的侵权视频检索,在很大程度上提高了侵权视频检索的性能和效率。
-
公开(公告)号:CN117611968A
公开(公告)日:2024-02-27
申请号:CN202311543191.1
申请日:2023-11-20
Applicant: 浙江大学
IPC: G06V10/82 , G06V10/40 , G06V10/764 , G06N3/04
Abstract: 本发明公开了一种计算机视觉神经网络模型后门攻击清除方法和系统,应用于图像识别领域,属于神经网络模型安全保护技术领域。将待处理的视觉神经网络模型分为特征提取器部分和分类器部分;对于视觉神经网络模型的每个预测类别,利用视觉神经网络模型的特征提取器部分生成多个特征表示;使用生成的特征表示构建数据集,将每个特征表示作为一个样本,样本标签为其生成时所对应的预测类别;利用构建的数据集对视觉神经网络模型的分类器部分进行微调,以清除视觉神经网络模型的后门攻击。本发明自动生成特征表示以构建微调数据集,填补了当前没有非数据依赖的神经网络模型后门清除技术的空白。
-
公开(公告)号:CN117496118A
公开(公告)日:2024-02-02
申请号:CN202311374926.2
申请日:2023-10-23
Applicant: 浙江大学
IPC: G06V10/25 , G06V10/764 , G06V10/82
Abstract: 本发明公开了一种目标检测模型的窃取脆弱性分析方法和系统,属于模型窃取和人工智能知识产权保护分析领域。包括:获取相应任务场景和预测类别的无标注样本集;基于不确定度的主动学习方法,从无标注样本集中筛选查询数据集并迭代训练替代模型;基于互联网样本的数据集增强,更新查询数据集;基于目标检测的多尺度一致性,优化更新后的查询数据集中的标注;基于优化标注后的查询数据集训练替代模型;根据替代模型和目标模型的性能分析结果判断目标模型的窃取脆弱性。本发明填补了现有研究中针对目标检测深度学习模型的模型窃取威胁分析的空缺。
-
公开(公告)号:CN114826959B
公开(公告)日:2023-10-13
申请号:CN202210410624.5
申请日:2022-04-19
Applicant: 浙江大学
IPC: H04L43/06 , H04L43/08 , H04L9/40 , H04L67/566 , H04L69/22
Abstract: 本发明公开了一种音频数据反爬虫技术脆弱性分析方法及系统,该方法包括以下步骤:(1)针对不同的网络层反爬虫策略,在请求报文层面进行对应的数据包字段修改,达成带有隐蔽性的数据采集请求;(2)将该数据采集请求发送到目标服务器,获取请求的返回结果,并从结果中解析待采集的目标地址,形成待采集目标地址队列;(3)针对基于采集目标推断的反爬虫技术,在待采集目标地址队列中通过随机算法添加无关的采集目标,从而进行应用层面的反爬虫技术脆弱性分析。本发明的方法可以对音频数据反爬虫技术进行有效的脆弱性分析。
-
公开(公告)号:CN116383814B
公开(公告)日:2023-09-15
申请号:CN202310644147.3
申请日:2023-06-02
Applicant: 浙江大学
Abstract: 本发明公开了一种神经网络模型后门检测方法和系统,属于神经网络模型安全保护技术领域。将目标神经网络模型划分为特征提取器部分和分类器部分,定义特征提取器部分的输出为中间层表示;通过最大化源类别的分类置信度的方式,逆向生成每一个源类别的中间层表示;由分类器部分获取每一个源类别的中间层表示的分类置信度向量,预处理每一个源类别的分类置信度向量,拼接得到分类置信度矩阵;根据分类置信度矩阵计算异常指标值,若异常指标值大于阈值,则判断目标神经网络模型存在后门,并定位后门的目标类别。本发明能够自动生成中间层表示而非依赖现成的辅助数据,且对于后门攻击的触发器形式不敏感,后门检测精度高,适用范围广。
-
公开(公告)号:CN118366010A
公开(公告)日:2024-07-19
申请号:CN202410781553.9
申请日:2024-06-18
Applicant: 浙江大学
IPC: G06V10/82 , G06V10/764 , G06V10/94 , G06V10/762 , G06N3/098
Abstract: 本发明公开了一种面向分割学习的模型后门攻击脆弱性分析方法和系统,属于人工智能安全领域。收集图像分类模型在分割学习过程中由客户端底层模型发送至服务器端中间模型的第一中间层表示,结合辅助数据集迭代训练底层替代模型;利用第一中间层表示训练聚类器,获取聚类类别到真实类别的映射关系,得到锚点;基于统计思想获取与图像触发器对应的中间层表示触发器;基于中间层表达形式的锚点替换目标类样本的后门攻击方法,向中间模型注入后门并训练;利用测试样本检测图像分类模型的后门攻击成功率,获得模型后门攻击脆弱性。本发明综合考虑了攻击测试方法的成功率和隐蔽性,可以更加全面的暴露模型在分割学习框架下的漏洞,推动防御技术的发展。
-
-
-
-
-
-
-
-
-