-
公开(公告)号:CN114529441B
公开(公告)日:2024-12-03
申请号:CN202210061192.1
申请日:2022-01-19
Applicant: 华南理工大学
Abstract: 本发明公开了一种图像频域数字水印方法、系统、装置及介质,其中方法包括:设计图像频域数字水印的嵌入与提取模型;将载体图片和水印输入水印嵌入提取自编码器后,得到带水印的第一图片,将第一图片随机加入噪声攻击后,再输入到水印嵌入提取自编码器的解码器中,得到粗提取水印;将第一图片随机选择裁剪攻击或不进行攻击,得到第二图片和标准置信度图,将第二图片输入到注意力得分器,输出注意力置信度图;将粗提取水印和注意力置信度图,在二维平面上逐像素相乘进行修正,得到最终的水印。本发明通过注意力得分器对待提取水印的图片进行分析,减少无水印部分对真正带水印部分的影响,得到更好的提取准确率,可广泛应用于信息安全技术领域。
-
公开(公告)号:CN114693607B
公开(公告)日:2024-08-20
申请号:CN202210229466.3
申请日:2022-03-09
Applicant: 华南理工大学
IPC: G06T7/00 , G06T7/30 , G06T5/10 , G06N3/0464 , G06N3/048 , G06N3/084 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多域块特征标志点配准的篡改视频检测方法及系统,该方法的步骤包括:提取各帧图像待检测区域;构建特征提取模块;计算待检测区域的RGB图像空域特征和DCT频谱;提取多尺度空域和频域特征进行特征拼接获得融合特征;融合特征输入注意力模块生成注意力引导特征;根据人脸标志点从注意力引导特征提取局部块特征和关键块特征;计算块特征间的相似度并拼接成相似度矩阵,输出二分类预测结果;采用二分类标签、帧图像局部篡改概率和帧图像边缘梯度对网络训练进行监督;利用训练好的模型进行预测分类,输出视频篡改检测结果。本发明利用人脸标志点对关键块特征的位置进行配准,提高了模型的泛化能力,优化模型对多个领域分类特征的学习。
-
公开(公告)号:CN113158789B
公开(公告)日:2023-08-25
申请号:CN202110275351.3
申请日:2021-03-15
Applicant: 华南理工大学
IPC: G06V20/10 , G06V10/52 , G06V10/764 , G06V10/766 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/048
Abstract: 本发明公开了一种遥感图像的目标检测方法、系统、装置及介质,其中方法包括以下步骤:获取待检测图片,对所述待检测图片进行特征提取,获得带有检测框的特征图;将所述特征图输入两级级联的检测网络,在第一级检测结构中采用多方向RoI Align获取所述特征图的方向敏感特征,使所述检测框带有角度参数;在第二级检测结构中采用多分支形变卷积模块对所述特征图进行对齐处理,获得最终的检测框,实现目标检测。本发明无需在区域提取网络阶段生成额外的多种朝向的候选框,而是提取多个不同方向的特征,计算量相对来说没有增长,同时获取的方向敏感特征对于回归分支有着比较好的增益效果,提升了模型的整体表现,可广泛应用于图像处理技术领域。
-
公开(公告)号:CN107965100A
公开(公告)日:2018-04-27
申请号:CN201711261423.9
申请日:2017-12-04
CPC classification number: E04F11/002 , E04F11/18 , E04F2011/007
Abstract: 本发明公开了一种可调节的装配式无障碍坡道,包括支撑机构、坡面与扶手,所述支撑机构包括有底座与升降脚,所述底座上设有插销,所述坡面的底面设有安装孔,所述安装孔与插销嵌套连接,所述坡面的表面设有安装槽,所述扶手插入在安装槽中。本发明通过利用升降脚可以对无障碍坡面的高度进行随意控制,而且坡面是通过可拆的方式与升降机构进行安装,使得整个无障碍坡道的装卸更加灵活方便。
-
公开(公告)号:CN119028027A
公开(公告)日:2024-11-26
申请号:CN202411002470.1
申请日:2024-07-25
Applicant: 华南理工大学
IPC: G06V40/30 , G06V40/16 , G06V10/42 , G06V10/774 , G06V10/764 , G06V10/82 , G06V10/74 , G06N3/0455 , G06N3/09
Abstract: 本发明公开了一种基于语言引导图片特征提取的活体检测方法及系统,该方法包括下述步骤:对人脸欺诈检测的视频数据集进行预处理,构建图片编码器和文本编码器;构建图片‑图片投影器和文本‑图片投影器,构建对比学习模块缩短对应的投影特征的距离,文本设计模块生成多组文本提示词;构建文本筛选模块,构建冻结文本编码器模块冻结文本编码器的预训练权重,通过余弦相似度计算和二元交叉熵计算与人脸最匹配的文本提示词,分类器根据文本提示词描述的真假判决人脸的真假,通过对对比学习模块、图片文本特征对齐模块、分类器的三个输出结果进行监督训练,基于训练后的模型得到人脸的真假预测结果。本发明判决人脸真假准确率更高,泛化性能更佳。
-
公开(公告)号:CN113076877B
公开(公告)日:2023-08-22
申请号:CN202110361159.6
申请日:2021-04-02
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于地面采样距离的遥感图像目标检测方法、系统和介质,方法包括以下步骤:获取遥感图像;对所述遥感图像进行特征提取和分类,得到所述遥感图像的地面采样距离预测结果;根据所述地面采样距离预测结果对所述遥感图像进行分割,得到多张图像序列;采用超分辨网络对所述多张图像序列分别进行特征提取、上采样和分辨率放大操作,生成目标图像序列;采用目标检测网络对所述目标图像序列进行目标检测,生成目标检测结果矩阵序列,所述目标检测网络为two‑stage式遥感目标检测网络。本发明能避免遥感图像中的目标具有多样性和复杂性对目标检测结果的影响,提高目标提取结果的准确性。本发明可广泛应用于遥感技术领域。
-
公开(公告)号:CN116471419A
公开(公告)日:2023-07-21
申请号:CN202310138253.4
申请日:2023-02-20
Applicant: 华南理工大学
IPC: H04N19/70 , H04N19/593 , H04N19/17
Abstract: 本发明公开的一种基于图像复杂度的多模型融合的CU划分方法,包括以下步骤:根据编码块的大小选择不同的混合模型;混合模型为预先建立并训练的模型;根据选择的模型对输入的编码单元进行处理,得到的值与编码单元的真实方差相比较,从而判断图像的复杂度,对编码单元的划分情况进行预测。本发明提供一个均值模型学习图像的均值,差值模型学习图像的方差,预测CU的划分结果,如果图像的像素值存在较大的差异,说明图像包含的信息比较多,CU倾向于划分成更小的CU,如果图像的像素值几乎相等,CU的大小基本保持不变。上述方法可以优化视频编码框架中的帧内预测模式,降低视频编码框架的编码复杂度,提升视频的编码效率。
-
公开(公告)号:CN114663986B
公开(公告)日:2023-06-20
申请号:CN202210329816.3
申请日:2022-03-31
Applicant: 华南理工大学
IPC: G06V40/40 , G06V40/16 , G06N3/0464 , G06N3/08 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开了一种基于双解耦生成和半监督学习的活体检测方法及系统,该方法步骤包括:数据预处理得到RGB颜色通道图原始样本,并配对相同身份得到真假图像对;真人编码器输出真人身份向量,假体编码器输出假体身份向量和假体模式向量,三者合并送入解码器得到重建真假图像对,构建双解耦生成损失函数,噪声送到训练好的解码器得到生成样本;对原始样本和生成样本构造有标签样本、无标签样本、增强后无标签样本,三者送入教师学习模块得到教师半监督损失、无标签样本的伪标签、增强后无标签损失,更新检测器和教师网络参数;利用验证集确定阈值;加载测试数据到检测器得到分类分数,根据阈值判决分类结果。本发明能够提高活体检测模型的鲁棒性。
-
公开(公告)号:CN115719462A
公开(公告)日:2023-02-28
申请号:CN202211391297.X
申请日:2022-11-08
Applicant: 华南理工大学
IPC: G06V20/40 , G06V40/16 , G06V40/40 , G06V10/40 , G06V10/62 , G06V10/764 , G06V10/82 , G06N3/0442 , G06N3/045 , G06N3/0464 , G06N3/09 , G06V10/77
Abstract: 本发明公开了一种基于时空域预测像素级篡改概率值的换脸视频检测方法及系统,该方法包括下述步骤:视频预处理,根据人脸关键点构建篡改掩膜,对篡改掩膜随机采样得到多个像素点的坐标位置以及对应的篡改值,对人脸图像进行空域特征和多层次时域特征提取得到时空特征,基于双注意力机制计算得到时空不一致特征,将时空不一致特征与像素点的坐标通道进行拼接,基于像素级位置篡改概率值重建进行辅助监督,对时空不一致特征进行二分类得到换脸视频篡改检测结果。本发明能够使时空特征更具全局性,能够根据坐标定位预测出该像素点的篡改概率值,在不同数据库均获得较好的准确率,其跨库检测性能优于现有算法,具有较好的域泛化性和通用性。
-
公开(公告)号:CN114693607A
公开(公告)日:2022-07-01
申请号:CN202210229466.3
申请日:2022-03-09
Applicant: 华南理工大学
IPC: G06T7/00 , G06T7/30 , G06T5/10 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/74 , G06V10/764 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于多域块特征标志点配准的篡改视频检测方法及系统,该方法的步骤包括:提取各帧图像待检测区域;构建特征提取模块;计算待检测区域的RGB图像空域特征和DCT频谱;提取多尺度空域和频域特征进行特征拼接获得融合特征;融合特征输入注意力模块生成注意力引导特征;根据人脸标志点从注意力引导特征提取局部块特征和关键块特征;计算块特征间的相似度并拼接成相似度矩阵,输出二分类预测结果;采用二分类标签、帧图像局部篡改概率和帧图像边缘梯度对网络训练进行监督;利用训练好的模型进行预测分类,输出视频篡改检测结果。本发明利用人脸标志点对关键块特征的位置进行配准,提高了模型的泛化能力,优化模型对多个领域分类特征的学习。
-
-
-
-
-
-
-
-
-