-
公开(公告)号:CN119027788A
公开(公告)日:2024-11-26
申请号:CN202410900407.3
申请日:2024-07-05
Applicant: 中国科学院自动化研究所 , 北京三快在线科技有限公司
IPC: G06V20/00 , G06V10/80 , G06V20/70 , G06V10/774 , G06V10/82
Abstract: 本发明提供一种文本图像篡改检测方法及装置,该方法包括:获取待检测文本图像;基于图像篡改检测模型对待检测文本图像进行处理,得到检测结果;图像篡改检测模型基于以样本RGB图像为训练样本,以黑白二值Mask图为训练标签,以目标语义信息为先验信息,以多尺度融合特征为训练特征对语义网络模型进行训练得到;目标语义信息通过对融合特征进行选择性扫描、多阶段语义轴向注意力解耦和上采样得到,多尺度融合特征通过对融合特征进行选择性扫描、多阶段语义轴向注意力解耦和多尺度融合解码得到。本发明所述方法利能够捕获到更加全面细致的目标表示,提高了图像篡改检测的泛化性和准确率。
-
公开(公告)号:CN119625590A
公开(公告)日:2025-03-14
申请号:CN202411439972.0
申请日:2024-10-15
Applicant: 中国科学院自动化研究所
IPC: G06V20/40 , G06V10/774 , G06V10/764 , G06V40/20
Abstract: 本发明提供一种伪造人体视频的鉴别方法、装置、电子设备及存储介质,该方法包括:对待鉴别的目标人体视频进行抽帧预处理,获取多组连续帧;将多组连续帧输入鉴别模型,得到鉴别模型输出的鉴别结果;其中,鉴别模型基于真实人体视频样本和伪造人体视频样本构成的训练样本集训练得到;鉴别模型包括时空注意力分支、光流调制模块、动作指引分支和分类器;时空注意力分支用于基于时空注意力机制对输入的多组连续帧进行视频片段级的特征提取,得到第一特征;光流调制模块用于对输入的多组连续帧进行光流调制;动作指引分支用于对光流调制得到的各帧进行逐帧的特征提取,得到第二特征;分类器用于基于第一特征和第二特征输出鉴别结果。
-