用于少样本缺陷图像生成的扩散模型微调方法和装置

    公开(公告)号:CN118823506A

    公开(公告)日:2024-10-22

    申请号:CN202410796707.1

    申请日:2024-06-20

    Abstract: 本发明涉及计算机视觉技术领域,提供了一种用于少样本缺陷图像生成的扩散模型微调方法和装置。方法包括:将多个缺陷词元和单个产品词元组合得到不平衡异常文本提示;选取少样本缺陷图像以及缺陷图像掩码作为缺陷图像分支的输入,根据缺陷图像掩码,将缺陷词元对齐到图像中的缺陷区域,优化第一目标函数和第二目标函数;选取固定数量的正常图像作为正常图像样本分支的输入,用不平衡异常文本提示中的与产品相关的部分,优化第三目标函数;混合训练策略用于使不同缺陷类别的缺陷图像共同参与训练。本发明在工业场景中每一缺陷类别的缺陷图像数量较少的情况下,依旧能够实现较理想的训练效果,从而使用训练完成的扩散模型生成缺陷图像。

    用于工业场景的细小微弱缺陷分割方法

    公开(公告)号:CN114863098A

    公开(公告)日:2022-08-05

    申请号:CN202210397331.8

    申请日:2022-04-15

    Abstract: 本发明公开了一种用于工业场景的细小微弱缺陷分割方法。所述方法包括以下步骤:利用深度卷积神经网络特征编码器对RGB图像进行多尺度特征提取来适应不同尺度的缺陷;特征解码器对特征编码器提取的多尺度图像特征进行融合上采样以尽可能保留细节信息,得到高分辨率高区分力的图像特征图;基于融合后的图像特征图,采用分类器对图像进行逐像素二分类,将图像中所有像素划分为正常像素和缺陷像素两类。本方法提出了一种将正常像素与缺陷像素损失平衡的目标函数,使模型更有效学习到细小微弱缺陷特征,大幅减少了对工业场景下细小微弱缺陷的漏检,实现了更准确的缺陷像素级分割。

    基于在线增强检测的视频文字目标追踪方法与电子设备

    公开(公告)号:CN111931571B

    公开(公告)日:2022-05-17

    申请号:CN202010643270.X

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。

    一种基于非对称空洞卷积的快速可行域分割方法

    公开(公告)号:CN112634289A

    公开(公告)日:2021-04-09

    申请号:CN202011585360.4

    申请日:2020-12-28

    Abstract: 本发明公开了一种基于非对称空洞卷积的快速可行域分割方法:对单目相机采集的图像进行多尺度图像特征提取,在最后一个卷积块使用非对称空洞卷积块消除局部噪声,获得具有区分力的表征;特征解码模块对特征编码器提取的多尺度图像特征进行逐点融合,得到高分辨率的高区分力的图像特征图;采用分类器基于融合后的图像特征,预测输出图像场景中的可行域分割结果,将图像中的所有像素划分为可行驶区域和不可行驶区域两类。本发明引入了一种全新的非对称空洞卷积模块来提高特征的区分力,大幅减少对不可行驶道路的误判,并且没有引入额外的计算量。基于轻量化的模块和网络设计,在保证精度的前提下,实现了对可行域的快速分割。

    基于在线增强检测的视频文字目标追踪方法与电子设备

    公开(公告)号:CN111931571A

    公开(公告)日:2020-11-13

    申请号:CN202010643270.X

    申请日:2020-07-07

    Abstract: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。

    一种基于多尺度自适应随机森林的激光雷达检测人腿方法

    公开(公告)号:CN111444769A

    公开(公告)日:2020-07-24

    申请号:CN202010116963.3

    申请日:2020-02-25

    Inventor: 周瑜 白翔

    Abstract: 本发明公开了一种基于多尺度自适应随机森林的激光雷达检测人腿方法,用于从2D激光雷达点云中检测出行人腿部。与传统的检测人腿的方法不同,该方法能够鲁棒地处理由于2D激光雷达数据的不稳定导致分类器检测能力下降的问题,同时也能够处理2D激光雷达数据的多尺度特性对检测的影响。首先,通过聚类算法将2D激光雷达点云聚类成多个点簇;其次,从每一个点簇中提取多维特征构成特征向量;进一步,将该特征向量输入分类器,分类器输出该点簇是人腿的置信度。该方法是针对2D激光雷达下进行人腿检测任务所提出的一种新颖的检测方法,其实现简单,易于扩展,具有较高的计算效率和检测准确度,能够部署在低成本机器人上,具有很强的实际应用价值。

Patent Agency Ranking