一种改进的深度分离层聚合和空间增强注意力的布匹瑕疵检测方法

    公开(公告)号:CN116485783A

    公开(公告)日:2023-07-25

    申请号:CN202310568829.0

    申请日:2023-05-19

    Abstract: 本发明针对布匹瑕疵本身形状不规则、长宽比例不均匀,包含背景纹理的情况,在改进YOLOv7的基础上,设计了新的模块DW‑ELAN和MPCOA。本发明首先采集了工业布匹瑕疵数据,将数据输入到网络结构中推理出结果,对检测出的布匹瑕疵进行标注。本发明针对布匹瑕疵检测难度大的特点,提出了一种基于深度分离层聚合和空间增强注意力的布匹瑕疵检测方法,该方法优化了YOLOv7的网络结构,基于ELAN提出了深度分离层聚合模块DW‑ELAN,使用5×5的深度可分离卷积替换3×3卷积,增大了网络感受野,提高网络对关键信息的提取能力。同时引入空间增强注意力模块MPCOA,替代了原本用最大池化层和卷积两个分支组成的MP2模块,利用注意力机制将空间中的关键特征信息保留到深层结构中,减少了一些位置信息的丢失,有效提高布匹瑕疵检测的准确率,使细节信息能在网络深层更好地表达。从总体上说,该网络的设计能有效地对布匹瑕疵进行实现检测,满足实际应用的需要。

    舌像分割方法
    3.
    发明公开

    公开(公告)号:CN103985113A

    公开(公告)日:2014-08-13

    申请号:CN201410089643.8

    申请日:2014-03-12

    Abstract: 本发明提供一种舌像分割方法,包括对获取到的表征舌体信息的舌像进行预处理,得到均衡化的灰度图像。去除得到的均衡化的灰度图像的背景,得到基础舌像;和计算得到的均衡化的灰度图像的熵值。根据熵值对基础舌像内的像素进行熵聚类,提取熵值满足设定值的区域,形成目标舌像。抽取目标舌像的骨架。在骨架上选取至少两对控制点,计算上述控制点对之间的最短测地路径,依次连接所有最短测地路径,得到舌像轮廓。本发明提供的舌像分割方法,利用局部熵特征增强舌像边缘等底层特征,且通过抽取最短测地距离自动获取针对每个特定舌体的模版,大大提高了分割的精度,具有更高的鲁棒性。

    一种用于小目标检测的网络模型及应用

    公开(公告)号:CN117829210A

    公开(公告)日:2024-04-05

    申请号:CN202410002966.2

    申请日:2024-01-02

    Inventor: 李笑岚 应铭

    Abstract: 本发明公开了一种用于小目标检测的网络模型及应用。本发明中的网络模型基于GLIP结构,将多模态的查询方式替换了原本的文本的查询方式,并利用跨模态的多头注意力机制使得文本特征中包含视觉引导,文本特征能够感知视觉细节。本发明还提供了一种小目标检测的网络模型在网球检测中的应用。本发明提出的基于GLIP的结构采用了添加跨模态的多头注意力机制把文本特征和图像特征进行交互,将多模态的查询方式替换了原本的文本的查询方式;并且利用跨模态的多头注意力机制使得文本特征中包含了视觉引导,文本特征感知视觉细节,使网络提取特征更完整丰富,增加了特征的表现力。

    一种针对缺乏文本信息的行人图像隐式类别提示学习方法

    公开(公告)号:CN117711070A

    公开(公告)日:2024-03-15

    申请号:CN202410025270.1

    申请日:2024-01-08

    Inventor: 李笑岚 陈新意

    Abstract: 本发明公开了一种针对缺乏文本信息的行人图像隐式类别提示学习方法。本发明在视觉语言预训练模型的基础上首先经过其图像编码器分支得到对应行人图像的全局表征,在文本编码器分支上,在文本编码器之前加入本发明提出的行人图像隐式类别提示学习模块PID_Learner,再将行人图像对应的下标输入PID_Learner得到对应行人图像的隐式类别提示标记,然后将这些隐式类别提示标记作为输入由文本编码器得到对应行人图像的文本特征。本发明解决了当大量行人图像缺乏对应文本信息时,无法利用大型视觉语言预训练模型进行行人重识别下游任务的难题。

    基于改进三阶递归门控卷积的针织棉布料结头瑕疵的检测方法

    公开(公告)号:CN116740016A

    公开(公告)日:2023-09-12

    申请号:CN202310696313.4

    申请日:2023-06-13

    Inventor: 李笑岚 陈新意

    Abstract: 本发明公开了一种基于改进三阶递归门控卷积的针织棉布料结头瑕疵的检测方法。本发明首先读取布料图像,将图像输入到检测网络中进行检测推理,并将模型的推理结果在布料图像上进行标注。本发明通过对yolov7网络模型进行高阶空间交互的改进,在颈部网络通过改进三阶递归门控卷积来融合图像特征,向三阶递归门控卷积加入多层感知机,显式增加高低阶空间的交互,保留了瑕疵的底层信息,提高对针织棉布料瑕疵检测尤其是结头瑕疵检测的准确率。本发明用于针织棉布料瑕疵检测可以有效提高布料产品的质量,无需人工干预检测,降低了企业人力成本和时间成本,提高企业的智能化生产水平。

    舌像分割方法
    7.
    发明授权

    公开(公告)号:CN103985113B

    公开(公告)日:2017-09-29

    申请号:CN201410089643.8

    申请日:2014-03-12

    Abstract: 本发明提供一种舌像分割方法,包括对获取到的表征舌体信息的舌像进行预处理,得到均衡化的灰度图像。去除得到的均衡化的灰度图像的背景,得到基础舌像;和计算得到的均衡化的灰度图像的熵值。根据熵值对基础舌像内的像素进行熵聚类,提取熵值满足设定值的区域,形成目标舌像。抽取目标舌像的骨架。在骨架上选取至少两对控制点,计算上述控制点对之间的最短测地路径,依次连接所有最短测地路径,得到舌像轮廓。本发明提供的舌像分割方法,利用局部熵特征增强舌像边缘等底层特征,且通过抽取最短测地距离自动获取针对每个特定舌体的模版,大大提高了分割的精度,具有更高的鲁棒性。

    一种基于场景样本库的影视图像深度提取方法

    公开(公告)号:CN106548494A

    公开(公告)日:2017-03-29

    申请号:CN201610847113.4

    申请日:2016-09-26

    CPC classification number: G06T2207/10016 G06T2207/20221

    Abstract: 本发明公开了一种基于场景样本库的影视图像深度提取方法,主要包括:深度场景库的建立、图片特征提取、深度图片融合、前景目标深度估计、深度图整体优化五部分。本发明利用普通RGB图片之间的相似性,将已有的深度图片中深度值迁移到输入目标图片;在实际影视制作过程中,可以建立多个场景库利用相似场景中的深度图片,生成输入目标图片的深度图;在此过程中能够将人工参与的深度调整减少的最低,提高工作效率,具有准确性高,处理时间短等特点。

Patent Agency Ranking