基于文本引导的零样本工业缺陷检测方法、设备及介质

    公开(公告)号:CN119784670A

    公开(公告)日:2025-04-08

    申请号:CN202411558780.1

    申请日:2024-11-04

    Abstract: 本发明公开了一种基于文本引导的零样本工业缺陷检测方法、设备及介质,其中方法包括:获取工业产品的图像以及文本语义标签,构建训练集和测试集;构建基于文本引导的零样本工业缺陷检测模型,采用训练集对模型进行训练;将测试集输入训练后的模型中进行测试;其中,在训练阶段,模型利用部分种类的工业产品中的缺陷信息,学习并扩展到其他工业产品的统一文本提示;在测试阶段,模型能够在从未训练过的工业产品种类上进行测试,检测其是否存在缺陷并定位缺陷。本发明充分利用预训练多模态大模型CLIP中蕴含的先验知识,使模型能够自适应地学习针对不同物体的通用文本提示,实现对各种工业产品的零样本缺陷检测,可广泛应用于计算机视觉技术领域。

    基于生成对抗模型的图像多属性联合编辑方法

    公开(公告)号:CN115546537A

    公开(公告)日:2022-12-30

    申请号:CN202211162789.1

    申请日:2022-09-23

    Inventor: 吴斯 魏希文 徐震

    Abstract: 本发明公开了一种基于生成对抗模型的图像多属性联合编辑方法,该方法包含两个可学习的组件:一个内容感知语义方向预测器,用于学习和推断一组语义方向,这些语义方向与输入图像相对应且与预设的语义属性相关联;一个语义方向融合网络用于非线性地融合与目标属性相关的语义方向,最终产生一个可以用于编辑多属性的语义方向。在此基础之上,通过施加基于属性感知特征的一致性正则化,进一步保证了编辑图像在不相关属性的保存,使得本发明在目标属性操控的准确性和不相关属性的保持能力都优于现有的方法。

    基于生成对抗神经网络的可控行人生成方法、设备及介质

    公开(公告)号:CN120047454A

    公开(公告)日:2025-05-27

    申请号:CN202510105687.3

    申请日:2025-01-23

    Inventor: 张天佑 徐震 吴斯

    Abstract: 本发明公开了一种基于生成对抗神经网络的可控行人生成方法、设备及介质,以判别器和生成器相互对抗的方式实现合成效果的提升;生成器整体为编码解码结构,并在解码器中引入了三分支结构:前景分支头合成行人特征图,背景分支头合成街景特征图,掩膜分支头合成行人的分割掩膜并以此指导前景分支与背景分支的特征图融合。判别器包括行人判别器和掩膜判别器,用于对抗训练提升生成器合成的行人、掩膜的真实程度,并且衡量掩膜是否能够准确分割出合成图像中的行人。模型另外通过损失函数约束输入的掩膜与合成的掩膜一致,从而实现依照指定的语义掩膜控制行人图像的合成。本发明可广泛应用于行人生成的技术领域。

Patent Agency Ranking