-
公开(公告)号:CN119762322A
公开(公告)日:2025-04-04
申请号:CN202411773306.0
申请日:2024-12-05
Applicant: 北京工业大学
IPC: G06T1/00 , G06F21/16 , G06V10/764 , G06V10/82 , G06N3/0464
Abstract: 本发明提供一种面向生成式模型的基于空域水印的图像数据集版权验证方法。该方法包括受保护数据集生成以及验证模块。受保护数据生成模块包括从原始数据集中选择固定比例样本,对选中样本进行添加水印操作,将原始数据集中未被选中的样本和水印样本集组成受保护的数据集。验证可疑模型是否使用受保护数据集模块包括:对全部样本进行进行添加水印操作,生成水印数据集;对水印数据集进行增强操作,生成增强数据集;使用水印数据集、增强数据集以及原始数据集训练水印分类器;令可疑生成模型随机生成样本;使用分类器判断生成的样本是否带有水印;使用假设检验的方式进行验证,验证上述可疑生成模型是否使用了受保护的数据集。
-
公开(公告)号:CN120086547A
公开(公告)日:2025-06-03
申请号:CN202411901554.9
申请日:2024-12-23
Applicant: 北京工业大学
IPC: G06F18/21 , G06F18/2131 , G06F18/214 , G06F18/2415 , G06F18/2431 , G06N3/0464 , G06F21/10
Abstract: 本发明涉及数据安全技术领域,提供一种面向文本到图像生成模型的数据集所有权保护方法,包括:步骤1:选取原始数据集中部分样本进行频域信号添加生成受保护数据集;步骤2:对原始数据集中所有样本进行信号添加生成信号数据集;步骤3:使用原始数据集以及信号数据集训练分类器来区分信号样本和原始样本,并记录分类器将不带信号的样本错误分类为1的概率;步骤4:令可疑模型生成N个样本;步骤5:使用训练好的分类器对生成样本进行判断,并统计分类器将可疑模型生成的样本预测标签预测为1的概率;步骤6:使用假设检验的方式给出可疑模型是否使用受保护数据集进行训练的证明。本发明能较佳地保护数据集所有权。
-