基于轻量化LA Transformer网络的图像分类系统及方法

    公开(公告)号:CN115984620A

    公开(公告)日:2023-04-18

    申请号:CN202310023318.0

    申请日:2023-01-09

    Applicant: 天津大学

    Inventor: 庄旭 王旗龙

    Abstract: 本发明公开了一种基于轻量化LATransformer网络的图像分类系统及方法,包括特征提取模块、LATransformer主体网络和图像分类模块,所述特征提取模块,负责对输入RGB图像进行局部特征提取,实现了输入图像的下采样,输出作为所述LATransformer主体网络的输入;所述LATransformer主体网络,负责对图像特征进行进一步的特征提取,通过局部自注意力子网络利用局部自注意力机制建模特征图补丁和补丁之间的空间相关性信息,以及通过注意力前馈神经子网络建模特征图通道和通道之间的相关性信息;所述图像分类处理模块,负责生成针对每个图像分类的概率,完成输入RGB图像的分类。本发明在参数量和计算量更低的同时还能够达到更高的图像分类精度。

    基于推理高效的动态优化早退模型、方法、系统及设备

    公开(公告)号:CN119721254A

    公开(公告)日:2025-03-28

    申请号:CN202411921894.8

    申请日:2024-12-25

    Applicant: 天津大学

    Abstract: 本发明公开了一种基于推理高效的动态优化早退模型、方法、系统及设备:在早退网络基础上,每个阶段分类分支中均插入旁支模块并进行残差连接,每个阶段的输出特征经对应旁支模块处理后,与对应阶段的输出特征进行残差连接,得到每个阶段新的分类特征,输入至对应分类器;每个分类器输出结果与置信度因子相乘,再经softmax函数获得预测分类概率值,再与输入图像对应标签计算交叉熵,得到每个阶段的损失;将上一阶段损失作为动态调整参数与本阶段损失相乘,得到本阶段动态调整后的损失;将所有阶段动态调整后的损失加权求和,得到最终总损失,利用该总损失训练模型;采用训练后的模型,对输入图像进行推理分类。

    一种基于改进YOLO v5的高空烟火检测方法

    公开(公告)号:CN115331141A

    公开(公告)日:2022-11-11

    申请号:CN202210927443.X

    申请日:2022-08-03

    Applicant: 天津大学

    Abstract: 本发明公开了一种基于改进YOLOv5的高空烟火检测方法:在多路高空摄像头视频流的情况下应用多线程队列算法,为每路视频流设置一个抽帧上传线程,并将所有线程的抽帧图片传入一个无限长的队列中;建立高空角度的烟火数据集,并进行数据清理和标注数据集工作;修改YOLOv5网络中的骨干网络,将每个CSP结构后的标准卷积层均替换为混合注意力模块;设定训练超参数,基于第二步建立的烟火数据集,对第三步改进后的YOLOv5网络进行训练,训练完成得到烟火检测模型,将第一步得到的图片输入烟火检测模型中进行烟雾和火焰检测。本发明通过改进后的目标识别算法提取视频流单帧完成对火灾异常现象的检测。

    一种基于时序感知模型微调的跨域小样本动作识别方法

    公开(公告)号:CN118552776A

    公开(公告)日:2024-08-27

    申请号:CN202410646661.5

    申请日:2024-05-23

    Applicant: 天津大学

    Abstract: 本发明公开了一种基于时序感知模型微调的跨域小样本动作识别方法,通过时序感知模型微调提出的HTTN模型进行跨域小样本动作识别,所述时序感知模型微调采用解耦范式,即先在源数据上对编码器Ecnoder进行预训练,然后再在目标数据上对预训练后的编码器Ecnoder进行微调。本发明在源数据集上对基于Transformer的大规模模型进行预训练接着在目标数据集上对其进行时序感知的参数高效微调,并且微调过程中引入局部时序感知适配器TAA和全局时序感知矩调谐器GTMT以在多个目标数据集上实现动作识别。

    用于时间序列预测的高斯嵌入式神经网络模型及建模方法

    公开(公告)号:CN112183733A

    公开(公告)日:2021-01-05

    申请号:CN202011139949.1

    申请日:2020-10-22

    Applicant: 天津大学

    Abstract: 本发明公开了一种用于时间序列预测的高斯嵌入式神经网络模型,该模型包括:一个长短时记忆神经网络层,一个高斯嵌入式模块以及一个反馈通路模块。长短时记忆神经网络层用于在系统的每一次迭代中完成单一样本的时序特征建模,高斯嵌入式模块用于样本不确定性信息,反馈通路模块用于实现网络的迭代优化,提高模型的训练效果。本发明中还公开了上述高斯嵌入式神经网络模型的建模方法。本发明中通过端到端方式将可训练的概率分布插入LSTM作为特征表示,在此基础上实现了自适应的统计特征学习,与现有技术相比有更好的预测效果,能获得全局性更优、泛化性能更好的建模结果。

    一种即插即用的前馈神经网络模块及视觉Transformer模型

    公开(公告)号:CN119129671A

    公开(公告)日:2024-12-13

    申请号:CN202411250834.8

    申请日:2024-09-06

    Applicant: 天津大学

    Abstract: 本发明公开了一种即插即用的前馈神经网络模块及视觉Transformer模型:即插即用的前馈神经网络模块采用非对称因子化双线性运算模型,包括第一支路、第二支路和全连接层,第一支路和第二支路并行设置,第一支路和第二支路的输出经逐元素相乘后作为全连接层输入;第一支路包括由输入至输出依次设置的第一分支通道映射层、第一分支空间映射层、激活函数层,第二分支包括由输入至输出依次设置的第二分支通道映射层、第二分支空间映射层;视觉Transformer模型包括输入嵌入层、多头注意力模块、前馈神经网络模块,前馈神经网络模块采用上述即插即用的前馈神经网络模块。本发明能取得更好的效率和效果的权衡,在视觉任务中发挥更强大的性能。

    基于门控局部通道注意力的神经网络图像分类方法

    公开(公告)号:CN114419361B

    公开(公告)日:2024-10-18

    申请号:CN202111550197.2

    申请日:2021-12-17

    Applicant: 天津大学

    Abstract: 本发明涉及神经网络、图像检测技术领域,为提升神经网络在图像分类和目标检测任务上的性能,本发明,基于门控局部通道注意力的神经网络图像分类方法,步骤如下:利用前置深层卷积网络获取输入图像的特征图;使用聚合模块进行处理所述特征图;使用激发模块处理所述特征向量,激发模块包括n+1个分支的分支结构,生成重加权后的特征图;重加权后的特征图作为后置深层卷积网络的输入,继续进行卷积提取特征的操作,完成图像分类和目标检测任务。本发明主要应用于图像识别分类场合。

    基于大规模预训练模型的图像分类系统及方法

    公开(公告)号:CN117765331A

    公开(公告)日:2024-03-26

    申请号:CN202311811273.X

    申请日:2023-12-27

    Applicant: 天津大学

    Abstract: 本发明公开了一种基于大规模预训练模型的图像分类系统及方法,同时将图像输入第一分支的图像预训练模型和第二分支辅助预训练模型进行特征提取;在辅助预训练模型的输出部分连接预测器,对所述预测器基于多分支训练策略和样本特征的初始化策略进行少样本训练;基于样本不确定度κ进行第一分支的预训练图像特征以及初始图像分类结果与第二分支的辅助预训练模型和预测器的经少样本训练的辅助图像分类结果logit融合;利用Softmax层对融合结果进行处理得到最终的图像分类结果。与现有技术相比,本发明利用预训练大模型实现了高效、准确的图像识别任务解决方案。

Patent Agency Ranking