-
公开(公告)号:CN115035302B
公开(公告)日:2024-09-20
申请号:CN202210787416.7
申请日:2022-07-05
Applicant: 南通大学
IPC: G06V10/26 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明提供一种基于深度半监督模型的图像细粒度分类方法,包括以下步骤:S1、获取原始图片,提取原始图片图像特征,组成全局特征矩阵;S2、对原始图片进行超像素分割,计算得出成特征分配映射;S3、将全局特征矩阵和特征分配映射进行非线性特征编码,得到超像素局部区域特征;S4、检测每个部分的发生概率,利用对齐概率分布得到超像素区域发生概率正则化项;S5、创建半监督神经网络,根据超像素区域发生概率正则化项和损伤函数训练半监督神经网络;S6、用训练好的半监督神经网络进行图像细粒度分类。本发明能够准确高效地对手写数字和医学细胞图像进行细粒度分类,兼具更优的图像细粒度分类准确率。
-
公开(公告)号:CN117423062A
公开(公告)日:2024-01-19
申请号:CN202311509438.8
申请日:2023-11-13
Applicant: 南通大学
IPC: G06V20/52 , G06V20/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06V40/10
Abstract: 本发明提供了一种基于改进的YOLOv5的建筑工地安全帽检测方法,属于计算机视觉目标检测技术领域。解决了目前检测精度低、小目标误检漏检、遮挡目标检测难度较大的技术问题。其技术方案为:包括以下步骤:S1、样本数据采集;S2、在Neck网络中使用AFPN结构代替FPN结构;S3、采用Slide Loss替换BCE‑loss;S4、边界框回归损失函数替换;S5、得到工人是否佩戴安全帽的结果。本发明的有益效果为:通过改进YOLOv5网络结构,分配更多的注意力给难样本,提取更多目标的特征信息,优化回归损失函数来提升检测精度和速度,减少建筑工地危险事故的发生。
-
公开(公告)号:CN116485749A
公开(公告)日:2023-07-25
申请号:CN202310440421.5
申请日:2023-04-23
Applicant: 南通大学
IPC: G06T7/00 , G06T7/13 , G06V10/764 , G06V10/774 , G06T7/62 , G06N3/0455 , G06N3/08
Abstract: 本发明涉及摄像头检测技术领域,尤其涉及一种基于自编码器的镜头模组中脏污识别方法。解决了在采集镜片图像时,需要人工干预,不适用于产线自动化生产的问题。其技术方案为:包括以下步骤:S1:收集若干张干净镜片的样本图片;S2:构建自编码神经网络,神经网络结构由编码器和解码器组成;S3:对输入图像进行预处理,截取图中的镜片区域;S4:自编码网络训练;S5:镜片脏污分类器训练。本发明的有益效果为:本发明能够自动识别成品模组中的镜片是否存在脏污,无需人工干预。
-
公开(公告)号:CN115113192A
公开(公告)日:2022-09-27
申请号:CN202210765033.X
申请日:2022-06-30
Applicant: 南通大学
Abstract: 本发明提供一种基于自适应波门的雷达航迹起始方法,包括获取初始扫描周期雷达点迹数据集;将获取的点迹的距离、径向速度转化为笛卡尔坐标下的距离和速度;生成临时航迹集;将其它周期据集中的点迹与临时航迹集中的所有航迹进行自适应波门约束匹配;判断波门中点迹个数,进行点迹筛选,并更新航迹质量;判断航迹质量,并根据质量得分确定航迹类型,对航迹进行起始或撤销。本发明利用多维量测信息进行航迹匹配,并根据航迹质量得分设置自适应波门的大小,以解决航迹起始的效率低以及因为航迹质量的大小影响目标跟踪性能的问题。
-
公开(公告)号:CN110929775B
公开(公告)日:2022-08-12
申请号:CN201911127264.2
申请日:2019-11-18
Applicant: 南通大学
Abstract: 本发明涉及到医学信息智能处理领域,具体来说涉及一种用于视网膜病变分类的卷积神经网络权值优化方法。该方法首先获取眼底图像训练集、及其对应的多病变标签;通过单种群蛙跳算法寻找最优初始权值,然后构建卷积神经网络中的卷积层、池化层和全连接层,将最优初始权值作为第一次前向传播计算的参数;将视网膜中四种病变的四个预测值分别与真实值进行交叉熵损失计算并求和得到损失值,判断损失值是否异常,如果异常则围绕前一次前向传播的权值生成蛙群,寻找最优蛙更新网络权值;否则采用梯度下降算法更新网络权值;最后对最终权值进行优化。本发明能有效提高眼底图像多病变检测的准确率,对视网膜疾病和辅助治疗具有较强应用价值。
-
公开(公告)号:CN114820371A
公开(公告)日:2022-07-29
申请号:CN202210453823.4
申请日:2022-04-27
Applicant: 南通大学
Abstract: 本发明属于图像处理技术领域,提供一种基于注意力模型的单幅图像去雨方法,包括以下步骤:S1、构建神经网络模型;S2、设计损失函数;S3、利用公开数据进行对神经网络模型的训练,得到神经网络模型的模型参数;S4、在神经网络模型中导入步骤S3训练好的模型参数,输入有雨图像,输出得到去雨图像。本发明要解决的技术问题是提供一种基于注意力模型的单幅图像去雨方法,设计了一种即插即用的通道‑空间注意力模块,通道注意力模块忽略了空间信息,而空间注意力模块又忽略了通道信息,结合两者优点将其应用在去雨网络中,取得了较好的效果。
-
公开(公告)号:CN114816516A
公开(公告)日:2022-07-29
申请号:CN202210452163.8
申请日:2022-04-27
Applicant: 南通大学
IPC: G06F8/73 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于多重源码表示和循环神经网络的代码注释生成方法,包括如下步骤:S1、收集Java代码注释对,构建语料库;S2、在序列化处理层,将语料库中的源代码转换为token序列、SBT序列和API序列;S3、在编码器层,使用双向GRU作为编码器,为3个序列分别构建codeseq编码器、SBTseq编码器和APIseq编码器,学习源代码不同级别的信息;S4、在解码器层,使用单向GRU构建解码器,并利用teacher forcing策略训练模型;S5、在3个编码器中的每个编码器后添加注意力层,将三个编码器输入和解码器输入的注意力矩阵链接起来并用一个全连接层学习如何组合每个输入的代码,最终输出代码注释。本发明提高代码注释生成的准确性,提高软件开发人员在软件开发过程中的效率,节省开发时间。
-
公开(公告)号:CN114676769A
公开(公告)日:2022-06-28
申请号:CN202210282073.9
申请日:2022-03-22
Applicant: 南通大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06V40/10 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开一种基于视觉Transformer的小样本昆虫图像识别方法,首先利用搜索引擎搜索各种昆虫的图像,对图像人工标注标签;然后构建以视觉Transformer为核心的预训练模型,并利用训练集对预训练模型中的参数进行优化训练;接下来移除预训练模型中的分类器,在训练集和测试集中随机抽取每类昆虫的少量图像样本,输入到视觉Transformer中提取图像特征,计算每类样本的平均值作为每类昆虫图像原型特征进行存储;最后在线采集昆虫图像,输入到Transformer中提取图像特征,计算其与每类昆虫图像表征之间的距离,其距离最近的昆虫类别就为此幅图像的类别输出。本发明使用少量训练样本对昆虫完成分类识别,能够克服目前昆虫识别中所使用的卷积神经网络训练时需要大量的图像样本的技术问题。
-
公开(公告)号:CN114626504A
公开(公告)日:2022-06-14
申请号:CN202210030247.2
申请日:2022-01-11
Applicant: 南通大学
IPC: G06N3/04 , G06N3/08 , G06N5/02 , G06V10/764 , G06V10/762 , G06V10/774 , G06V10/82 , G06K9/62
Abstract: 本发明公开一种基于群组关系知识蒸馏的模型压缩方法,该方法在完成对数据集的预处理之后,随机初始化一个大容量的卷积神经网络作为教师网络,利用交叉熵损失函数对该网络进行预训练;随后在知识蒸馏阶段,随机初始化一个小容量的卷积神经网络作为学生网络,教师网络和学生网络分别对图像样本特征进行K均值聚类,并利用最大均值差异计算各组之间的关系,利用交叉熵与群组关系损失函数的加权和对学生网络进行训练。最后利用训练好的网络对测试图像进行分类决策。该方法能够指导学生网络模仿老师对样本的分组能力,从而使得学生网络的性能逼近老师网络的性能。
-
公开(公告)号:CN114580552A
公开(公告)日:2022-06-03
申请号:CN202210228607.X
申请日:2022-03-10
Applicant: 南通大学
IPC: G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/774 , G06V10/82
Abstract: 本发明公开一种基于迁移模型的小样本茶叶图像分类方法,该方法首先利用摄像头采集茶叶图像构建茶叶图像分类数据集,然后构建迁移模型,并利用茶叶基类图像数据基于交叉熵损失函数与监督损失函数的加权和利用梯度下降法对迁移模型进行训练,最后将迁移模型中基类分类器、旋转预测分类以及Softmax层移除,使用原型分类器完成小样本茶叶图像分类测试。本发明在卷积神经网络训练过程中引入自监督任务提高模型的迁移性,将此迁移模型应用到小样本茶叶图像分类任务中,能够提高小样本茶叶图像分类识别的性能。
-
-
-
-
-
-
-
-
-