-
公开(公告)号:CN114943862A
公开(公告)日:2022-08-26
申请号:CN202210637417.3
申请日:2022-06-07
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/46
Abstract: 本发明公开了一种基于结构性解析字典学习的两阶段图像分类方法,该方法属于计算机视觉技术领域。该方法包括:(1)特征提取:对原始图像数据进行特征提取,构建训练集和测试集;(2)阶段1:基于训练集采用结构性解析字典学习模型训练解析字典及投影矩阵;(3)阶段2:基于训练样本的结构化稀疏表示系数,训练支持向量机(SVM)分类器;(4)分类测试:在测试集上利用训练好的解析字典和支持向量机,使用多元支持向量机分类算法实现分类功能,得到分类结果。本发明简化了结构性解析字典学习(SADL)模型,并将分类器学习过程和字典学习过程分离,使用支持向量机代替原本的线性分类器,从而提出了基于结构性解析字典学习两阶段图像分类方法。本发明方法适用于一般情况下的图像分类问题,在人脸识别、场景识别、物体识别上的分类准确率均能超过原算法。
-
公开(公告)号:CN118262218A
公开(公告)日:2024-06-28
申请号:CN202410516293.2
申请日:2024-04-26
Applicant: 南京工业大学
IPC: G06V10/82 , G06N3/0464 , G06N3/0475 , G06N3/094 , G06N3/0455 , G06N3/044 , G06V20/13
Abstract: 本发明公开了一种基于改进SimVP的卫星云图序列预测方法。涉及深度学习领域。具体步骤:(1)、预处理卫星云图序列数据并划分训练集和测试集;(2)、基于已有的SimVP架构,在编码器和解码器中添加多头注意机制模块和局部残差连接,用Poolformer网络作为翻译器,并在网络末端添加SRGAN网络的生成器;(3)、联合运动感知损失函数和L2损失函数来监督模型进行训练;(4)、预测卫星云图序列图像。本发明在多层卷积神经网络中引入多头注意力机制,可以很好的提取卫星云图序列数据的高维特征,使模型在学习时序相关性的同时保持序列的空间信息;并且引入生成器来提高预测云图的分辨率,解决了因预测图像模糊导致的特征丢失等问题;同时将运动感知损失函数与传统的L2损失函数相结合来监督模型训练,可以进一步获取卫星云图序列相邻帧之间的运动信息。本发明不仅适用于所有的卫星云图序列图像,也可应用于其他一些复杂场景下的序列图像预测。
-
公开(公告)号:CN117953285A
公开(公告)日:2024-04-30
申请号:CN202410095256.9
申请日:2024-01-23
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/084 , G01W1/10
Abstract: 本发明公开了一种基于注意力LSTM网络的天气预测方法,属于机器学习领域。该方法包括:获取天气数据集,对数据集进行预处理,将其划分为训练集和测试集,得到用于训练和测试预测网络的序列数据;在PredRNN++网络预测单元Causal LSTM的基础上,本发明提出时序LSTM预测单元(Temporal Attention LSTM,TA‑LSTM),通过引入时序注意力模块(Temporal Attention Module,TAM),拓宽了预测网络的时间感受野,增强了网络的时间信息建模能力,同时,通过引入局部注意力机制(Local Attention,LA),增强了网络的空间信息建模能力;堆叠多层TA‑LSTM单元,构建天气预测网络;利用训练集对网络进行训练,优化网络参数;将测试集输入到训练好的预测网络,获得预测的天气序列,并使用评价指标对预测结果进行评估。与现有的预测方法相比,使用TA‑LSTM预测网络能得到更准确的预测结果。
-
公开(公告)号:CN116822703A
公开(公告)日:2023-09-29
申请号:CN202310511846.0
申请日:2023-05-08
Applicant: 南京工业大学
IPC: G06Q10/04 , G06N3/049 , G06N3/0464 , G06N3/084 , G06V10/74 , G06V10/774
Abstract: 本发明公开了一种基于改进ConvGRU的时空序列预测方法,属于机器学习领域。该方法包括:获取用于训练的图像序列数据,将获得的数据划分为训练集与测试集并对数据进行预处理;对ConvGRU进行改进,引入时空记忆,构建时空序列预测单元ST‑GRU;将ST‑GRU进行堆叠构建预测网络;利用训练集对网络进行训练,确定网络参数;将测试集输入训练好的网络模型中得到预测结果。本发明可弥补ConvGRU难以对长期时空依赖性进行建模的不足,相较于ConvGRU,带有时空记忆的ST‑GRU可以显著增强捕获时空序列时间以及空间相关性的能力。
-
公开(公告)号:CN114330535A
公开(公告)日:2022-04-12
申请号:CN202111603440.2
申请日:2021-12-24
Applicant: 南京工业大学
IPC: G06K9/62
Abstract: 本发明公开了一种基于支持向量正则化字典对学习的模式分类方法,属于计算机视觉技术领域。该方法包括:将训练图像和测试图像映射到低维空间,得到训练集和测试集;基于训练集采用支持向量正则化的字典对学习模型学习综合‑解析字典对和支持向量机分类器;利用训练好的字典对生成测试集编码系数;将测试集编码系数输入到支持向量机分类器中,得到测试集的类别标签,以类别标签作为分类结果。本发明基于字典对学习模型,提出融合支持向量的判别性分类模型并进行优化求解,适用于一般情况下的模式识别和图像分类问题,在人脸识别和场景识别上能达到较高的分类准确度。
-
公开(公告)号:CN114330535B
公开(公告)日:2024-09-06
申请号:CN202111603440.2
申请日:2021-12-24
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/772 , G06V10/774 , G06V10/77
Abstract: 本发明公开了一种基于支持向量正则化字典对学习的模式分类方法,属于计算机视觉技术领域。该方法包括:将训练图像和测试图像映射到低维空间,得到训练集和测试集;基于训练集采用支持向量正则化的字典对学习模型学习综合‑解析字典对和支持向量机分类器;利用训练好的字典对生成测试集编码系数;将测试集编码系数输入到支持向量机分类器中,得到测试集的类别标签,以类别标签作为分类结果。本发明基于字典对学习模型,提出融合支持向量的判别性分类模型并进行优化求解,适用于一般情况下的模式识别和图像分类问题,在人脸识别和场景识别上能达到较高的分类准确度。
-
公开(公告)号:CN114943862B
公开(公告)日:2024-09-17
申请号:CN202210637417.3
申请日:2022-06-07
Applicant: 南京工业大学
IPC: G06V10/764 , G06V10/774 , G06V10/46
Abstract: 本发明公开了一种基于结构性解析字典学习的两阶段图像分类方法,该方法属于计算机视觉技术领域。该方法包括:(1)特征提取:对原始图像数据进行特征提取,构建训练集和测试集;(2)阶段1:基于训练集采用结构性解析字典学习模型训练解析字典及投影矩阵;(3)阶段2:基于训练样本的结构化稀疏表示系数,训练支持向量机(SVM)分类器;(4)分类测试:在测试集上利用训练好的解析字典和支持向量机,使用多元支持向量机分类算法实现分类功能,得到分类结果。本发明简化了结构性解析字典学习(SADL)模型,并将分类器学习过程和字典学习过程分离,使用支持向量机代替原本的线性分类器,从而提出了基于结构性解析字典学习两阶段图像分类方法。本发明方法适用于一般情况下的图像分类问题,在人脸识别、场景识别、物体识别上的分类准确率均能超过原算法。
-
-
-
-
-
-