-
公开(公告)号:CN119559543A
公开(公告)日:2025-03-04
申请号:CN202411482548.4
申请日:2024-10-23
Applicant: 东南大学
IPC: G06V20/40 , G06V10/30 , G06V10/36 , G06V10/44 , G06V10/54 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种融合内容无关特征与内容相关特征的深度伪造图像检测法。首先,通过高斯滤波器、Gabor滤波器和小波滤波器分别得到平滑图像、纹理图像和细节图像,融合后经特征金字塔网络处理,获得基于频率域特征的真伪概率;其次,通过反锐化掩模和DnCNN去噪模型得到差值图像和噪声图像,融合后同样经特征金字塔网络处理,获得基于空间域特征的真伪概率。频率域与空间域特征共同构成图像的内容无关特征。此外,通过ViT模型提取图像的内容相关特征,获得基于内容相关特征的真伪概率。最终,将三种真伪概率加权融合,输出图像的真伪判定结果。本发明在跨生成模型及不同数据源的伪造图像检测中表现优异,具备较强的泛化性和通用性。
-
公开(公告)号:CN118609015A
公开(公告)日:2024-09-06
申请号:CN202410644380.6
申请日:2024-05-23
Applicant: 新型显示与视觉感知石城实验室 , 东南大学
IPC: G06V20/40 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0442
Abstract: 本发明公开了一种基于帧差卷积神经网络的视频重点区域分析方法,包括:利用SVM分类器对每个视频帧进行分类,确定视频帧所属类别;基于卷积神经网络和LSTM网络构建场景类别识别模型,用于对视频帧进行场景类别标记;根据场景类别设计热力图提取方案,对输入的图像数组数据生成灰度图作为热度权重;根据视频帧所属类别,利用热力图与加权矩阵相乘得到的结果,获取权值最大的区域作为截取部分的中心点;根据计算出的截取部分的中心点坐标对视频帧进行裁剪,将处理后的竖屏画面在前端进行显示。本发明能够准确地进行视频的裁剪,最后在前端显示出裁剪后视频画面的重点部分,提供更好的竖屏观看体验。
-