-
公开(公告)号:CN119068286A
公开(公告)日:2024-12-03
申请号:CN202411105388.1
申请日:2024-08-13
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06V10/774 , G06V10/764 , G06V10/75 , G06V10/82 , G06N3/094
Abstract: 本发明公开了一种基于通用潜在感染的对抗样本制备方法,首先获取干净样本集和目标样本集,将目标样本集所包含的类别划分为已知类别和未知类别,将属于已知类别集合的目标样本构成目标样本集,构建包括特征提取器,尺寸匹配模块和生成器的对抗样本生成模型,该模型通过对目标样本提取特征并进行尺寸匹配后叠加至生成器对应的感染层输入,从而对干净样本进行感染生成对抗样本;采用训练样本集对对抗样本生成模型进行训练,然后对于干净样本集中每个干净样本,任意选择一个与其类别不同的目标样本一起输入训练好的对抗样本生成模型生成对抗样本。本发明所构建的对抗样本生成模型支持基于任何目标样本生成对抗样本,从而提高对抗样本生成的通用性。
-
公开(公告)号:CN118966314A
公开(公告)日:2024-11-15
申请号:CN202411119125.6
申请日:2024-08-15
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06N3/094 , G06V10/82 , G06V10/25 , G06V10/774 , G06V10/764 , G06N3/084
Abstract: 本发明公开了一种针对目标检测模型的对抗训练方法,首先收集干净样本构成训练样本集将目标检测模型初步训练到收敛,然后依次生成置信度任务对抗样本集、分类任务对抗样本集和定位任务对抗样本集,并分别采用各个对抗样本集对目标检测模型进行对抗训练,在对抗训练时计算损失函数对目标检测模型中各个参数的梯度敏感度,将高梯度敏感度的参数进行更新,其他参数则不更新,循环以上过程进行对抗训练直到达到对抗训练结束条件。本发明通过拆分对抗训练任务并生成不同对抗样本进行参数更新,从而减轻不同任务之间的梯度冲突,在不增加网络容量的情况下,平衡目标检测模型在对抗样本上的鲁棒性和在干净样本上的准确率。
-
公开(公告)号:CN119729148A
公开(公告)日:2025-03-28
申请号:CN202411788288.3
申请日:2024-12-06
Applicant: 电子科技大学(深圳)高等研究院
IPC: H04N21/845 , G06N3/045 , G06N3/0475 , G06N3/0455 , G06N3/098 , G06T1/00
Abstract: 本发明公开了一种基于生成对抗网络的快速水印方法,属于数字水印技术领域。本发明基于一致性水印的快速生成框架,解决现有深度学习水印方法计算资源需求大的问题。传统方法需要重复调用深度模型来为每张图像或视频生成水印,计算成本高。本发明仅需一次生成水印,即可将其嵌入任意图像或视频中,无需重复调用深度模型。并且在水印效果上能够媲美现有的方法。适用于需要高效嵌入水印的场景,具有广泛的应用前景。
-
公开(公告)号:CN119600322A
公开(公告)日:2025-03-11
申请号:CN202411142457.6
申请日:2024-08-20
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06V10/764 , G06V10/82 , G06V10/774 , G06F17/14
Abstract: 本发明公开了一种基于低频增强的小样本图像分类迁移方法,将现有图像分类模型划分为图像特征编码器和分类器,对于图像特征编码器中每个卷积核设置一个卷积核适配器,将卷积核适配器和分类器的参数作为可学习参数,其他参数固定为图像分类模型预训练得到的参数值,然后进行多轮训练,每个轮次中从每个图像分类任务的小样本集中采样得到支持集和查询集进行训练,在训练完毕后根据每个轮次的平均预测精度选择平均预测精度最大的模型参数作为最终的图像分类模型参数。本发明可以有效提高小样本图像分类迁移的学习速度、降低显存消耗并提高学习鲁棒性。
-
公开(公告)号:CN118916520A
公开(公告)日:2024-11-08
申请号:CN202411020426.3
申请日:2024-07-29
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06F16/783 , G06F16/732 , G06F16/33 , G06F16/332 , G06F18/22 , G06F18/25 , G06V20/40 , G06V20/70 , G06F40/126 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于全局与局部语义的视频‑文本检索方法,构建包括文本特征提取模块,视频特征提取模块,全局交互模块,局部交互模块和相似度融合模块的视频‑文本跨模态匹配模型,全局交互模块用于对文本特征提取模块和视频特征提取模块所提取得到的文本特征和视频特征计算得到全局相似度,局部交互模块用于基于Transformer编码器对文本的词特征和视频特征计算得到局部相似度,再由相似度融合模块将全局相似度和局部相似度融合得到视频‑文本的匹配度。本发明构建视频‑文本跨模态匹配模型,通过挖掘跨模态的潜在共享语义来优化视频‑文本检索。
-
公开(公告)号:CN118968546A
公开(公告)日:2024-11-15
申请号:CN202410970722.3
申请日:2024-07-19
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06V40/10 , G06V10/75 , G06V10/26 , G06V10/30 , G06V10/44 , G06V10/82 , G06N3/0455 , G06N3/0464
Abstract: 本发明公开了一种基于轮廓信息的人体姿态估计域泛化方法,首先设置三个子模型并分别采用相应的训练样本集进行预训练,包括实例分割模型,轮廓检测模型和初始人体姿态估计模型,然后基于预训练好的三个子模型构建基于轮廓信息的人体姿态估计模型,采用两个轮廓检测模型分别从输入图像和分割得到的行人图像中提取人体轮廓并融合得到最终的人体轮廓,在初始人体姿态估计模型中视觉提取编码器中每层Transformer编码器后增加幅度处理模块用于对特征进行增强,对基于轮廓信息的人体姿态估计模型进行训练后,采用该模型估计得到输入图像的人体姿态图像。本发明通过引入轮廓信息提高人体姿态估计域泛化的性能。
-
公开(公告)号:CN118821086A
公开(公告)日:2024-10-22
申请号:CN202410926631.X
申请日:2024-07-10
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06F21/16 , G06F40/279 , G06F40/30
Abstract: 本发明公开了一种针对大语言模型转述攻击的基于句子语义的水印方法,在生成式大语言模型生成新的词语标记时,先根据输入标记序列生成词汇表中每个词语标记的对数概率,采用语义嵌入模型得到当前输入标记序列的语义嵌入向量,并将其投影至预先设置的向量空间,得到对应的投影语义嵌入向量,从中选取最小的若干元素序号构成绿色列表,对于词汇表中每个词语标记,如果属于绿色列表则根据预设的水印强度对其对数概率进行修正,如果不属于绿色列表则当前对数概率即为修正后的对数概率,根据修正后的对数概率选择新的词语标记,如此循环,生成水印文本。本发明通过生成绿色列表并指导新词语标记的生成逻辑,以抵抗对于大语言模型的转述攻击。
-
公开(公告)号:CN118797726A
公开(公告)日:2024-10-18
申请号:CN202411084305.5
申请日:2024-08-08
Applicant: 电子科技大学(深圳)高等研究院
IPC: G06F21/62 , G06V40/10 , G06V10/774 , G06F16/583
Abstract: 本发明公开了一种基于稳定扩散模型的行人图像数据集处理方法,首先对于待匿名处理的行人图像数据集中每张行人图像生成对应的提示文本,根据实际需要构建稳定扩散模型并进行预训练,然后采用行人图像数据集对其进行微调训练,然后生成与行人图像数据集的提示文本不同的新提示文本,分别多次输入微调训练后的稳定扩散模型生成行人图像,为根据同一个新提示文本所生成的所有行人图像分配相同的行人身份ID,构成匿名行人图像数据集。本发明对行人图像数据集进行有效匿名处理,在不牺牲数据集性能的前提下有效保护行人图像的隐私。
-
公开(公告)号:CN119652714A
公开(公告)日:2025-03-18
申请号:CN202411804530.1
申请日:2024-12-10
Applicant: 电子科技大学(深圳)高等研究院
IPC: H04L27/00 , G06N3/0464 , G06N3/0475 , G06N3/0499 , G06N3/094 , G06N3/098 , G06F18/15 , G06F18/214 , G06F18/2431
Abstract: 本申请公开了一种基于生成对抗学习的未知信号识别方法,涉及信号调制识别技术领域。本申请通过引入生成器和判别器的对抗训练机制,利用生成对抗网络产生与已知类别信号相似而不同的混淆样本参与训练,以此增强分类模型对未知类别信号的识别能力,并保持原有调制识别性能,同时本申请为生成器提供一种结合分类器的损失函数,使生成器生成的混淆样本靠近真实样本数据的分布,确保生成的混淆样本在数据分布上与已知类样本足够接近,同时又保持一定的未知性,进一步保证分类模型对未知类别信号的识别性能。
-
公开(公告)号:CN119094788A
公开(公告)日:2024-12-06
申请号:CN202411055109.5
申请日:2024-08-02
Applicant: 电子科技大学(深圳)高等研究院
IPC: H04N19/20 , H04N19/42 , G10L19/008 , G10L19/012
Abstract: 本发明公开了一种基于增强视频扩散模型的动作视频生成方法,根据实际情况设置动作的参考视频集合,根据实际需要构建文本编码器,变分自编码器和扩散U‑Net模型并分别采用相应的训练样本集进行预训练,基于以上子模型构建增强视频扩散模型并采用若干源视频对增强视频扩散模型进行训练,在训练过程中通过添加噪声将源视频特征转换为噪声,然后利用增强视频扩散模根据参考视频的视觉信息以及文本描述预测噪声,利用噪声的差距计算损失函数更新模型参数;将字幕文本和噪声输入训练好的增强视频扩散模型,即可生成对应的动作视频。本发明可以无需对未经训练的动作进行任何进一步的微调即可根据字幕文本准确生成动作视频。
-
-
-
-
-
-
-
-
-