一种基于多尺度注意力的传统图像伪造定位装置及方法

    公开(公告)号:CN116612267A

    公开(公告)日:2023-08-18

    申请号:CN202310462846.6

    申请日:2023-04-26

    Abstract: 本发明涉及一种基于多尺度注意力的图像伪造定位装置及方法,属于图像处理技术领域,解决了现有技术中图像伪造检测定位区域边缘不够清晰和定位结果不够准确的问题。本发明通过传统伪造图像合成模块,生成类型丰富、方式多样的合成伪造图像,增强装置对各类型伪造的泛化性;通过伪造区域边缘特征提取模块将伪造区域特征特征中与伪造区域边缘相关的部分提取并强化,充分利用了边缘操作带来的伪造痕迹,边缘清晰度高;通过多尺度空间注意力模块将不同尺度的空间特征逐级融合,由较小尺度特征提供粗粒度的伪造区域预测,再结合较大尺度特征以及边缘特征进行细粒度的伪造区域预测,实现了更精细的伪造区域定位;装置训练易于控制、装置训练充分。

    视差图修正方法、装置、设备和计算机可读介质

    公开(公告)号:CN114782290A

    公开(公告)日:2022-07-22

    申请号:CN202210715254.6

    申请日:2022-06-23

    Abstract: 本公开的实施例公开了视差图修正方法、装置、设备和计算机可读介质。该方法的一具体实施方式包括:获取双目图像中的左图像和右图像;将左图像和右图像重复输入多分支的立体匹配网络,得到各个分支对应的各个分支概率分布信息集合;根据各个分支概率分布信息集合,生成分支目标概率分布信息集合和预测分支置信度信息集合;根据分支目标概率分布信息集合和预测分支置信度信息集合,生成预测视差图的置信度信息;根据置信度信息,修正预测视差图,得到修正视差图。该实施方式可以在训练过程中无需提供置信度信息标签,即可在半监督、全监督、无监督等任务中生成视差图的置信度信息,从而可以用于修正视差图。

    一种基于傅里叶变换的风格迁移伪造图像检测装置及方法

    公开(公告)号:CN111127407B

    公开(公告)日:2022-06-28

    申请号:CN201911263941.3

    申请日:2019-12-11

    Abstract: 本发明公开了一种基于傅里叶变换的风格迁移伪造图像检测装置,包括傅里叶变换模块,用于构建频域图像集;第一部分检测特征构建模块,用于构建第一部分检测特征;第二部分检测特征构建模块,用于构建第二部分检测特征;模型训练模块,用于将两部分检测特征合并为完整特征向量,并利用训练图像集的标签进行模型训练,获得分类器;伪造图像检测模块,用于将检测图像的两部分检测特征合并,并利用所获得的分类器进行检测,给出检测结果。本发明通过研究傅里叶频域上的风格迁移伪造检测,可以对现有的伪造图像检测方法进行补充,并且提高图像造假的难度。

    基于表征学习的棋类局面转化模型建立、转化方法及装置

    公开(公告)号:CN114663732A

    公开(公告)日:2022-06-24

    申请号:CN202210571639.X

    申请日:2022-05-25

    Abstract: 本申请涉及基于表征学习的基于表征学习的棋类局面转化模型建立、转化方法及装置,属于图像识别技术领域。本申请包括:通过骨干网络提取预先标注好的棋局局面图片的特征,分层提取所述特征生成多尺度特征层;将所述多尺度特征层输入到目标检测特殊层中生成多个候选框,对所述多个候选框进行筛选获得标准候选框;计算所述标准候选框与预先标注之间的损失值,通过梯度下降调整模型参数使得损失值不再降低或达到预设的迭代次数,获得棋类局面转化模型;通过本申请解决现有技术中,只能匹配模板库内已有的模板,对于新的图像,无法进行准确匹配,且基于模板匹配的方法,对图像尺寸要求严苛,若图像尺寸不匹配,匹配精度也会降低的问题。

    一种基于几何轮廓顶点预测的遥感影像建筑物分割方法

    公开(公告)号:CN114529552A

    公开(公告)日:2022-05-24

    申请号:CN202210202403.9

    申请日:2022-03-03

    Abstract: 本发明公开了一种基于几何轮廓顶点预测的遥感影像建筑物分割方法,本方法首先使用两阶段检测网络结构,通过该网络从遥感影像中提取建筑物的特征信息,利用ROI‑Align操作对建筑物检测框进行操作得到建筑物的特征图,然后在该特征图上使用基于注意力机制的长短时记忆网络对建筑物轮廓进行建模预测,在轮廓预测过程中,先做边缘检测和关键点检测,将关键点得分最高的顶点作为开始顶点,输入到基于注意力机制的长短时记忆网络中开始预测,直到碰到结束标志或达到最大时序长度时结束预测,最后将预测的顶点结果映射到原图,并按照顺序相连得到建筑物的轮廓。

    手写表格的检测与识别方法及装置

    公开(公告)号:CN113221778B

    公开(公告)日:2022-05-10

    申请号:CN202110546506.2

    申请日:2021-05-19

    Abstract: 本申请涉及一种手写表格的检测与识别方法及装置,手写表格的检测与识别方法包括获取表格图像,在表格图像中获取白色连通域信息,根据白色连通域信息确定多个白色连通域的外接矩形框,统计各个外接矩形框的面积大小及数量,根据各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,根据单元格内容的连通域检测识别表格结构。本申请对获取的表格图像质量要求低,简单易操作,并且通过各个外接矩形框的面积大小及数量筛选出单元格内容的连通域,在文字与表格框出现粘连时仍能有效识别且识别准确性高。

    手写棋谱录入方法及设备
    37.
    发明公开

    公开(公告)号:CN114299526A

    公开(公告)日:2022-04-08

    申请号:CN202111602980.9

    申请日:2021-12-24

    Abstract: 本申请涉及一种手写棋谱录入方法及设备,方法包括:获取手写棋谱图像;基于交互式区域生长算法将手写棋谱图像有序分割成多个独立表格区域,将分割得到的各独立表格区域压入第一堆栈中,依次从第一堆栈中提取独立表格区域并获取独立表格区域对应的字符信息,将各独立表格区域对应的字符信息进行标注并保存。由于各独立表格区域均对应一张手写棋谱表格,本申请中,在待识别的手写棋谱图像中包含多个手写棋谱表格时,基于交互式区域生长算法对多个手写棋谱表格进行有序分割并依次单独识别,由于手写棋谱表格是进行有序分割的,后续可以将识别出的字符信息根据其对应的手写棋谱表格进行标注后进行保存。

    一种基于互补内容感知的多模态事件检测方法

    公开(公告)号:CN114154587A

    公开(公告)日:2022-03-08

    申请号:CN202111503622.2

    申请日:2021-12-10

    Abstract: 本发明涉及多模态处理技术领域,提供了一种基于互补内容感知的多模态事件检测方法。该方法包括:将经过预处理的包括图像和文本的多模态数据集,随机划分成训练集和验证集;采用图像编码器和文本编码器提取图像和文本的特征,构建多模态图结构;基于多模态图结构,构建多模态事件检测模型;通过多模态事件检测模型损失函数和反向传播算法训练多模态事件检测;将多模态图结构输入至目标多模态事件检测模型,获得多模态事件检测结果。本发明的方案,拓展了多模态事件检测的思路,提高了事件检测的效果,弥补了复杂多模态关系建模不充分的缺陷。

    一种基于层级图卷积网络的群体场景图生成方法

    公开(公告)号:CN113901902A

    公开(公告)日:2022-01-07

    申请号:CN202111155721.6

    申请日:2021-09-30

    Abstract: 本发明公开了一种基于层级图卷积网络的群体场景图生成方法,利用预训练卷积神经网络提取体育视频中所有个体的视觉特征和包围盒,聚类为两个队伍,根据视觉特征构造队伍关系图和群体关系图,将队伍关系图输入队伍图卷积网络提取队伍关系特征,将群体关系图输入群体图卷积网络提取群体关系特征,根据队伍关系特征和群体关系特征生成群体场景图,上述方法能有效捕捉体育视频中群体间关系,生成群体场景图进行体育视频理解。在团体对抗型体育项目中,运动员个体间关系被弱化,队伍间关系得到凸显,因此能简化场景图生成方法的应用场景,将场景图生成方法应用于体育视频捕捉群体间关系,生成群体场景图进行体育视频的理解。

    基于DQN的图像增强处理方法及装置

    公开(公告)号:CN112258420A

    公开(公告)日:2021-01-22

    申请号:CN202011205932.1

    申请日:2020-11-02

    Abstract: 本申请涉及基于DQN的图像增强处理方法及装置,其方法包括,步骤1、获取待处理的图像,初始化评价总分;步骤2、基于预先构建的操作选择网络对待处理图像的每一像素点进行数值操作,得到待评价图像,其中操作选择网络基于DQN算法构建及更新;步骤3、采用预设评价方式对待评价图像进行评分,根据得到的奖励分数对评价总分进行累加更新;步骤4、将评价总分与预定阈值进行比较,当其小于等于第一阈值时,将其清零,跳转执行步骤2,当其大于第一阈值且小于第二阈值时,以待评价图像作为新的待处理图像,跳转执行步骤2,当其大于等于第二阈值时,以待评价图像作为图像增强处理后的图像。本申请消除了图像增强处理对成对数据集的依赖,大幅降低了数据搜集难度。

Patent Agency Ranking