-
公开(公告)号:CN118798821A
公开(公告)日:2024-10-18
申请号:CN202411139998.3
申请日:2024-08-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06Q10/10 , G06Q10/0637 , G06Q10/04 , G06Q40/04
Abstract: 本申请涉及大数据大模型技术领域,提供了数据流通交易违规行为处理方法,该方法包括:基于数据流通交易的历史违规行为相关法律文书,构建历史违规行为所属类型对应的证据链;通过监控目标数据流通交易的过程,预测目标数据流通交易所属违规行为的类型;根据目标数据流通交易所属违规行为的类型和历史违规行为所属类型对应的证据链,确定目标数据流通交易的证据相关联的证据类型;根据目标数据流通交易的证据相关联的证据类型,构建目标数据流通交易的证据链;根据目标数据流通交易的证据链计算违规权重并与由具有相同违规行为类型的历史违规行为的证据链计算出的违规权重进行比较,确定目标数据流通交易是否违规。本申请的技术方案可以对数据流通交易过程中的违规行为进行有效判定和溯源。
-
公开(公告)号:CN113742775B
公开(公告)日:2023-07-28
申请号:CN202111049937.4
申请日:2021-09-08
Applicant: 哈尔滨工业大学(深圳)
IPC: G06F21/62 , G06V10/764 , G06N20/00
Abstract: 本发明提供一种图像数据安全检测方法、系统及介质,其中机器学习分类模型在训练前,利用预设恶意扩充方法扩充数据持有端的原始训练集,得到第一扩充集和第二扩充集,其中第一扩充集记录有原始训练集的样本图像,第二扩充集存储有原始训练集各类别标签的标签编码,并同时利用原始训练集、第一扩充集和第二扩充集进行训练;模型提供端则可在本地利用相同扩充方法还原第一扩充集和第二扩充集,并将第二扩充集输入至训练后的分类模型,还原出原始训练集中各类别标签与标签编码的对应关系,进而便可利用第一扩充集及该对应关系对原始训练集进行还原及泄露检测,避免数据窃取攻击在标签编码未知时难以检测的问题,增强了安全人员对数据泄露的检测能力。
-
公开(公告)号:CN115455668A
公开(公告)日:2022-12-09
申请号:CN202211029674.5
申请日:2022-08-26
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明公开了一种针对表格数据的仿真数据生成方法、装置及电子设备,所述方法包括:获取累计分布表及逆累计分布表;根据累计分布表对原始数据做变换,获取变换后每一列均值和列协方差矩阵;根据获取每一列均值和列协方差矩阵生成联合高斯分布数据,最后通过查逆累计分布表仿真数据生成。本发明针对表格数据的仿真数据生成,适用于集中场景和分布式场景,生成仿真数据技术效率高,所需时间短,同时,在分布式情况下的生成数据质量高,尤其是联邦情况和非平衡情况下的仿真数据质量仍然能够满足下游任务和数据探索的需求。
-
公开(公告)号:CN114549931B
公开(公告)日:2025-01-14
申请号:CN202210157952.9
申请日:2022-02-21
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/774 , G06N20/00
Abstract: 本发明提供一种面向机器学习模型的数据恢复方法,可对机器学习模型的训练过程进行调整,以使模型利用其所包含的模型权重的线性组合记录训练集数据,进而可在无法接触训练集数据的情况下通过线性组合训练后的模型权重值来恢复训练集数据。由于采用所有模型权重进行记录,因此相较于现有的相关性编码攻击而言准确性更高,且不易降低模型的性能。本发明还提供一种面向机器学习模型的数据恢复装置、电子设备及存储介质,具有上述有益效果。
-
公开(公告)号:CN113742775A
公开(公告)日:2021-12-03
申请号:CN202111049937.4
申请日:2021-09-08
Applicant: 哈尔滨工业大学(深圳)
Abstract: 本发明提供一种图像数据安全检测方法、系统及介质,其中机器学习分类模型在训练前,利用预设恶意扩充方法扩充数据持有端的原始训练集,得到第一扩充集和第二扩充集,其中第一扩充集记录有原始训练集的样本图像,第二扩充集存储有原始训练集各类别标签的标签编码,并同时利用原始训练集、第一扩充集和第二扩充集进行训练;模型提供端则可在本地利用相同扩充方法还原第一扩充集和第二扩充集,并将第二扩充集输入至训练后的分类模型,还原出原始训练集中各类别标签与标签编码的对应关系,进而便可利用第一扩充集及该对应关系对原始训练集进行还原及泄露检测,避免数据窃取攻击在标签编码未知时难以检测的问题,增强了安全人员对数据泄露的检测能力。
-
-
公开(公告)号:CN114549931A
公开(公告)日:2022-05-27
申请号:CN202210157952.9
申请日:2022-02-21
Applicant: 哈尔滨工业大学(深圳)
IPC: G06V10/774 , G06K9/62 , G06N20/00
Abstract: 本发明提供一种面向机器学习模型的数据恢复方法,可对机器学习模型的训练过程进行调整,以使模型利用其所包含的模型权重的线性组合记录训练集数据,进而可在无法接触训练集数据的情况下通过线性组合训练后的模型权重值来恢复训练集数据。由于采用所有模型权重进行记录,因此相较于现有的相关性编码攻击而言准确性更高,且不易降低模型的性能。本发明还提供一种面向机器学习模型的数据恢复装置、电子设备及存储介质,具有上述有益效果。
-
-
-
-
-
-