-
公开(公告)号:CN110119776A
公开(公告)日:2019-08-13
申请号:CN201910387408.1
申请日:2019-05-10
Applicant: 长沙理工大学
IPC: G06K9/62
Abstract: 本发明公开了基于多核学习K-SVD的识别方法及其系统,方法包括:将经验图像训练转化为列向量形成字典D;通过多核函数将字典D分类训练得到字典D';将字典D'通过K-SVD进行字典更新,得到字典D”;将待识别图像与字典D”进行冗余计算,得到残差值集合;获取残差值集合中的最小值,判断最小残差值是否在预设的阈值范围内;若最小残差值在预设的阈值范围内,则完成图像识别匹配。通过将多核函数引入K-SVD字典学习,通过对所有样本进行分类训练字典,得到一个过完备字典,该字典可以为每个信号原子提供最佳表示,可以有效地解决待处理图像分类不完备的问题,为训练得到的字典的稀疏性提供保障;对处理识别图像时,识别准确率高。
-
公开(公告)号:CN111797936A
公开(公告)日:2020-10-20
申请号:CN202010670001.2
申请日:2020-07-13
Applicant: 长沙理工大学
Abstract: 本发明公开一种基于显著性检测和多层次特征融合的图像情感分类方法首先利用显著性检测网络提取情感图像的显著性图;再通过孪生神经网络实现显著性图的特征图对对应情感图像的特征图的调制,以便于Inception-v4网络对情感图像的情感表达区域更多的关注度,从而有效提高图像情感分类的精度;最后利用Inception-v4网络对经孪生神经网络调制后的调制特征图进行分类,以准确获得对应情感图像的情感类别。本发明提供的图像情感分类方法可准确的定位情感图像中的情感表达区域,并通过特征调制的方式实现让分类网络在情感图像的情感表达区域给予更高的注意力,从而有效提高图像情感分类方法的准确率。
-
公开(公告)号:CN110650340A
公开(公告)日:2020-01-03
申请号:CN201910336500.5
申请日:2019-04-25
Applicant: 长沙理工大学
IPC: H04N19/132 , H04N19/177 , H04N19/19 , H04N19/42 , H04N19/597 , G06T5/00 , G06K9/46 , G06K9/62
Abstract: 本发明涉及一种时空复用的压缩视频成像方法,在成像系统中采用空间和时间复用压缩感知模块先后对光学信号进行调制,实现三维随机线性投影。从输入的三维信号的三个切面对信号进行解析表示,获得信号与系数沿各个维度的拉伸矩阵,通过三维张量的解析字典学习的共稀疏优化模型,对解析字典进行学习,得到图像帧的解析稀疏表示字典和视频信号的时间稀疏表示特征。通过时空复用的压缩视频成像方法,重建视频信号。根据视频重建的优化模型,重建一个初始视频估计,然后应用增广拉格朗日方法和应用变量替换将多约束的优化问题分解为多个子问题,最终采用交替方向方法求解,完成图像的重建。由于融合视频信号时空非局部相似性和其它结构化特性,构建视频信号互独立的多先验约束重建优化目标函数,降低解的自由度,引导优化问题的解趋向视频信号的固有特性。
-
公开(公告)号:CN118781631A
公开(公告)日:2024-10-15
申请号:CN202410922870.8
申请日:2024-07-10
Applicant: 长沙理工大学
IPC: G06V40/10 , G06V10/40 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/084 , G06V10/764 , G06V20/52
Abstract: 本发明公开了一种基于通道级特征选择与融合网络的可见与红外行人重识别方法。包括数据预处理模块、特征选择模块、通道级特征融合模块、损失计算优化、相似度计算以及获取查询结果模块。其特征在于使用基于ResNet‑50的双流特征提取器构建主干网络,利用在ImageNet上预训练的模型初始化主干网络,提出的特征选择模块,利用行人样本在不同通道上特征重要性的差异来实现特征选择;提出的通道级特征融合模块根据被选择特征在各对应通道下的通道掩膜进行双通道均值加权融合得到融合特征,并且防止了融合过程中部分重要特征信息被干扰。所述的方法提升了行人特征的多样性,减小了不同模态图像间的差异,并在两个数据集上的查询结果均取得了优秀的性能。
-
公开(公告)号:CN116011684A
公开(公告)日:2023-04-25
申请号:CN202310192969.2
申请日:2023-03-02
Applicant: 长沙理工大学 , 湖北武荆高速公路发展有限公司
Abstract: 本发明提出了一种基于时空图卷积网络的交通流量预测方法,旨在解决交通速流量预测中数据高维、非线性、不确定性等难以解决的问题。所提出的预测模型包括全连接神经网络层、时空卷积块和一维卷积层。交通流量数据经过全连接层后进入时空卷积块,以捕获流量数据的时间特征与空间特征。最后,时空卷积块的结果输入一维卷积层得到最后的预测结果。时空卷积块包括时间卷积网络层、时间注意力层、图卷积层、门控融合层。时间卷积网络层与时间注意力层用于捕获交通流量不同尺度的时间特征,图卷积层用于动态捕获空间特征,门控融合层用于融合不同尺度的特征矩阵。时空卷积块动态捕获了交通流量不同尺度的时空特征且筛选了重要的部分,提高了预测精度。
-
公开(公告)号:CN113033675B
公开(公告)日:2022-07-01
申请号:CN202110339588.3
申请日:2021-03-30
Applicant: 长沙理工大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04
Abstract: 本申请涉及一种图像分类方法、装置和计算机设备。所述方法包括:获取图像样本,通过第一池化层对经过卷积后的特征图中的每个池化框进行k次最小池化,对k个最小值取平均值得到最小池化平均值;通过第二池化层对图像样本进行平均池化,得到平均池化特征图;根据预先设置的权重,对平均池化特征图进行加权,得到每个池化框对应的极端门限值;若最小池化平均值小于极端门限值,则舍弃池化框中的最小值后进行平均池化,得到图像样本对应的去极端特征图;利用去极端特征图训练图像分类模型,得到训练好的图像分类模型;获取待分类图像的去极端特征图,将去极端特征图输入训练好的图像分类模型,得到图像类别。采用本方法能够提高图像分类的准确性。
-
公开(公告)号:CN118171813A
公开(公告)日:2024-06-11
申请号:CN202410280518.9
申请日:2024-03-12
Applicant: 长沙理工大学
IPC: G06Q10/063 , G06Q10/04 , G06Q50/40 , G06F18/213 , G06F18/25 , G06N3/0464 , G06N3/048 , G06N3/049 , G06N3/08
Abstract: 本发明公开了一种基于跨时间的全局空间注意力网络的交通预测方法,该方法设计了一个交通预测模型。该模型包括跨时间的全局空间注意力模块、全连接时间卷积块、时间注意力块和一个门控输出模块。首先利用跨时间的全局空间注意力模块建模交通矩阵中跨时间的空间依赖性,直接捕获不同节点在多时间维度之间的相关性。随后利用时间卷积块和时间注意力块分别捕获节点自身的短期连续时间相关性和长期语义相关性。最后使用一个门控输出模块融合不同模块提取到的交通特征。由于交通流量在实际道路中存在跨时间的空间依赖,本发明针对真实交通模式设计了跨时间的全局空间注意力模块能够更合理的提取到交通数据之间存在的空间相关性,提高了预测精度。
-
公开(公告)号:CN116092294A
公开(公告)日:2023-05-09
申请号:CN202310194728.1
申请日:2023-03-02
Applicant: 长沙理工大学
IPC: G08G1/01 , G08G1/048 , G06F30/27 , G06F18/214 , G06F17/16 , G06F119/02
Abstract: 本发明涉及一种基于Transformer与图注意力网络的高速公路交通流量预测方法,该交通流量预测模型包含图注意力网络与Transformer网络。图注意力网络用于捕获交通流量的空间相关性,Transformer用于捕获交通流量的时间相关性,利用线性层输出每一步的预测结果。该模型将交通流量划分为近期流量、日周期流量、周周期流量,对交通流量的周期性显式建模。此外,该模型将天气因素引入该预测模型中用于动态地调整不同时间片之间的依赖程度。图注意力网络中使用注意力机制结合预定义邻接矩阵对交通流量的空间相关性动态建模。使用Transformer网络对交通流量的时间相关性进行建模,提高长期预测的精度。本发明中涉及的交通流量预测方法基于数据驱动,无需人工特征工程设计,实施起来更加灵活。
-
公开(公告)号:CN114613013A
公开(公告)日:2022-06-10
申请号:CN202210274825.7
申请日:2022-03-18
Applicant: 长沙理工大学
IPC: G06V40/20 , G06V40/10 , G06V10/44 , G06K9/62 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于骨骼节点的端到端人类行为识别方法与模型。深度学习网络模型的构建包括:视频序列人体行为跟踪;骨骼关节点检测识别;生成骨骼序列时空图拓扑;骨骼序列训练前预处理;使用深度学习网络训练获得的骨骼时空序列以获取人类行为语义特征表示;在不同层网络结构中对骨骼关节点进行端到端的优化;最终网络分类器识别人类行为类别。本发明意在从视频序列获取人体骨骼关节点,通过提出一个对骨骼关节实现端到端的优化的方法,在深度学习网络模型框架下对骨骼关节图拓扑进行建模,学习一个更优的骨骼关节图拓扑结构,从而达到更优的行为识别准确率。
-
公开(公告)号:CN110113607B
公开(公告)日:2022-02-01
申请号:CN201910336663.3
申请日:2019-04-25
Applicant: 长沙理工大学
IPC: H04N19/132 , H04N19/177 , H04N19/19 , H04N19/42 , H04N19/597
Abstract: 本发明涉及一种基于局部与非局部约束的压缩感知视频重建方法,在压缩感知重建视频模型中引入局部与非局部约束,利用基于图像帧最小全变差(Total Variation,TV)约束和基于序列时空相似块矩阵的低秩约束,引导优化模型的解趋向三维视频序列的固有特征。优化问题求解过程中首先采用传统方法进行对视频中每帧图像压缩感知图像进行重建,得到的图像帧的一个初始估计,然后引入辅助变量并将问题分解为一个TV优化子问题和一个低秩优化子问题,交替求解,并在内循环中进一步地将TV子问题和低秩优化子问题分解为可微的和求解的部分分别求解。由于发明的方法充分考虑了图像帧的时空局部与非局部特征,因而提高了图像的重建质量。
-
-
-
-
-
-
-
-
-