一种基于对抗训练与关键路径提取的图像隐写分析方法

    公开(公告)号:CN111222583B

    公开(公告)日:2023-11-17

    申请号:CN202010042082.1

    申请日:2020-01-15

    Abstract: 本发明公开了一种基于对抗训练与关键路径提取的图像隐写分析方法,包括:对于待检测图像,分别输入至经过对抗训练的隐写分析模块、以及基于关键路径提取的隐写分析模块;所述待检测图像包括:非隐写图像、传统隐写图像和对抗嵌入隐写图像,其中传统隐写图像和对抗嵌入隐写图像都属于隐写图像的类别;获得两个模块各自输出的待检测图像为隐写图像的概率,再结合两个模块的权重,采用加权融合的方式,获得最终待检测图像为隐写图像的概率。该方法可以检测经过对抗嵌入生成的隐写图像,同时在一定程度上权衡了对抗训练带来的传统隐写图像和非隐写图像准确率下降问题。

    一种图像识别方法及装置

    公开(公告)号:CN111461323B

    公开(公告)日:2022-07-29

    申请号:CN202010174891.8

    申请日:2020-03-13

    Abstract: 本发明提供了一种图像识别方法,包括:S1,获取训练图像集,将训练图像集中的各训练图像与该训练图像对应的类别索引进行训练,学习提取无语义视觉表达;S2,将训练图像集中各训练图像与该训练图像所对应的语义标签对齐,学习提取语义对齐的视觉表达;S3,同时对无语义视觉表达及语义对齐的视觉表达进行识别分析,得到视觉偏见消除模型;S4,将待识别图像输入视觉偏见消除模型,进行识别。本发明提供的图像识别方法通过建立视觉偏见消除模型,可以提升对已知域和未知域样本的感知效果,进而实现无偏差零样本的准确识别。

    一种图像分级粒度迁移方法、系统、设备和介质

    公开(公告)号:CN111291803B

    公开(公告)日:2022-07-29

    申请号:CN202010074068.X

    申请日:2020-01-21

    Abstract: 本发明提供了一种图像分级粒度迁移方法、系统、设备和介质。所述方法包括:获取图像的视觉特征、父类别语义描述和子类别语义描述;利用双语义保留网络将所述视觉特征与所述父类别语义描述进行第一匹配,通过所述第一匹配预测图像的父类别;通过所述图像的父类别确定图像子类别的范围;获取所述视觉特征中的预设区域视觉特征,利用双语义保留网络将所述预设区域视觉特征与所述子类别语义描述在所述子类别的范围中进行第二匹配,通过所述第二匹配预测图像的子类别。实现了仅使用父类别的图像标注和分级粒度的类别描述来解决对应下属子类别的识别问题。

    场景文字检测方法
    5.
    发明授权

    公开(公告)号:CN110263877B

    公开(公告)日:2022-07-08

    申请号:CN201910567794.2

    申请日:2019-06-27

    Abstract: 本发明公开了一种场景文字检测方法,包括:利用神经网络对输入图像进行特征提取,并对提取的特征图进行上采样操作,得到不同尺寸的特征图;以最大尺寸的特征图为标准,将其余尺寸的特征图映射为与最大尺寸的特征图相同的尺寸;将映射到相同尺寸的特征图进行尺度信息的融合,得到融合后的特征图,这一融合操作能够使不同尺寸的文字在融合后的特征图中统一激活;对融合后的特征图进行文字框的回归和分类操作,得到场景文字检测结果。上述方法能够从根本上提升特征图的质量,从而提升场景文字检测的性能。

    基于多目标拉格朗日正则的细粒度图像识别方法

    公开(公告)号:CN110378356B

    公开(公告)日:2021-07-02

    申请号:CN201910644312.9

    申请日:2019-07-16

    Abstract: 本发明公开了一种基于多目标拉格朗日正则的细粒度图像识别方法,包括:通过神经网络提取输入图像的图像特征X,得到相应的双线性图像A;从双线性图像A中获取规则化特征Y,构建包含矩阵平方根,低秩以及稀疏约束项的目标函数;引入两个辅助的变量来弱化三个约束项之间的关联性,并将目标函数转化为一个增广拉格朗日形式,再通过交替地优化每一个矩阵约束项来得到一个全局近似最优解;利用该全局近似最优解进行图像的识别分类。该方法仅仅包含矩阵乘法,因此能够很好地被GPU兼容,达到更快的识别速度,且该方法能够有效地对双线性图像表达同时进行平方根,低秩,和稀疏的正则约束,极大的提高了识别准确率。

    图像处理模型的确定方法、装置、设备及存储介质

    公开(公告)号:CN113052240A

    公开(公告)日:2021-06-29

    申请号:CN202110328519.2

    申请日:2021-03-26

    Abstract: 本公开关于一种图像处理模型的确定方法、装置、设备及存储介质,涉及图像处理领域。本公开实施例中,对于每个样本图像,通过增加旋转图像,考虑到旋转图像的哈希码与样本图像的哈希码一致的特性,引入了另一种损失值,结合这种损失值与训练样本图像之间相似度的损失值,对图像处理模型的模型参数进行更新,能够使得图像处理模型在获取到更准确的哈希码,基于哈希码进行后续处理,也能够得到更准确的处理结果,因而能够提高该图像处理模型的准确性,且旋转图像为对样本图像进行几何变换得到的,这样该图像处理模型对几何变换前后的图像均能够进行准确处理,具有更好的鲁棒性,且无需标注数据,减少了人工成本,提高数据处理效率。

    一种基于视觉语言建模网络的场景文字识别方法

    公开(公告)号:CN112541501A

    公开(公告)日:2021-03-23

    申请号:CN202011502420.1

    申请日:2020-12-18

    Abstract: 本发明公开了一种基于视觉语言建模网络的场景文字识别方法,训练过程中,通过使视觉模型直接在被遮挡的文字图像特征中识别完整的词级结果,引导视觉模型根据视觉上下文信息推理出被遮挡的文字内容,从而赋予视觉模型语言能力;因此,在不需要引入额外语言模型结构的情况下,视觉模型自适应地在视觉上下文中捕捉语言信息来增强视觉特征,从而提升识别能力。并且,整个字符级掩码的生成过程只需要原有的词级标注,不需要引入额外的标注信息;测试过程中只使用了主干网络和视觉语义推理模块进行识别,因此位置感知的掩码生成模块只在训练过程中使用,不引入额外的计算开销。

    基于网络信息传播图建模的社交媒体谣言检测方法

    公开(公告)号:CN112199608A

    公开(公告)日:2021-01-08

    申请号:CN202011211346.8

    申请日:2020-11-03

    Abstract: 本发明公开了一种基于网络信息传播图建模的社交媒体谣言检测方法,包括:以用户的帖子为节点,根据帖子的转发层次关系和时间维度关系建立传播图模型,并且根据用户的ID信息在传播图模型中构建相同用户的帖子连接关系;将预训练模型提取的各个帖子的文本特征作为初始的节点表示特征,并利用消息传递图神经网络根据帖子之间关系进行信息的聚合,进而更新节点表示特征;将更新后的节点表示特征与初始的节点表示特征连接后,通过分类器预测帖子为谣言与非谣言的概率。该方法能够提高谣言检测的准确性,实现有效的谣言检测,并具有适用性强,易于迁移等优点。

    基于忆阻器的混合逻辑同或电路以及同或计算阵列

    公开(公告)号:CN111817710A

    公开(公告)日:2020-10-23

    申请号:CN202010724264.7

    申请日:2020-07-24

    Abstract: 本发明公开了一种基于忆阻器的混合逻辑同或电路以及同或计算阵列,混合逻辑同或电路中,利用忆阻器存储数据,并和输入完成与逻辑计算,然后将该结果通过CMOS电路(CMOS或非门)完成更复杂的或非逻辑计算;将该电路扩展为阵列形式,从而得到多bit同或计算结果。该混合逻辑同或电路与传统同或门相比减少了4个晶体管,以及1个存储单元(如SRAM),实现了存算一体化,减少了数据的传输时间,整体功耗降低。

Patent Agency Ranking