-
公开(公告)号:CN118898638A
公开(公告)日:2024-11-05
申请号:CN202411399217.4
申请日:2024-10-09
Applicant: 南昌工程学院
IPC: G06T7/246 , G06T3/4038
Abstract: 本发明提出一种基于尺度感知卷积特征提取网络的目标跟踪方法与系统,该方法包括:将模板图像和搜索图像输入预测模型,通过尺度感知卷积模块中的多头混合卷积模块处理,得到多头混合卷积模块的输出特征图;随后利用尺度感知卷积模块中的感知聚合模块的分组和聚合功能,得到尺度感知卷积模块的的输出特征图;将模板特征图和搜索特征图进行拼接,得到拼接后的特征图;通过扩展注意力模块引入扩展因子并进行注意力计算得到扩展注意力的输出特征;将扩展注意力的输出特征输入到中心预测头模块进行预测,并进行目标跟踪。本发明可以使跟踪器实现局部信息和全局信息之间一个更好的平衡,从而在面对背景干扰、快速移动时实现鲁棒性更强的跟踪。
-
公开(公告)号:CN119741578B
公开(公告)日:2025-05-09
申请号:CN202510240847.5
申请日:2025-03-03
Applicant: 南昌工程学院
IPC: G06V10/80 , G06V10/82 , G06T5/94 , G06T3/4038 , G06N3/0985 , G06N3/0455
Abstract: 本发明提出一种基于紧凑轴向注意力和细节增强的目标跟踪方法与系统,该方法包括:将模板图像和搜索区域图像输入至特征提取网络中进行统一特征学习,得到输出特征图;利用大规模数据集对优化的特征提取网络依次进行预训练和参数调整;将模板图像和搜索区域图像输入至参数调整后的特征提取网络中进行特征提取;将细节融合特征依次进行展平操作和拼接操作,并输入至特征融合模块中进行特征融合;将包含信息的融合特征输入至预测头,获取目标跟踪框,利用目标跟踪模型对目标跟踪框进行跟踪,得到跟踪结果;本发明通过细节增强模块使跟踪器能够在保持全局语义理解的同时,恢复和利用局部细节信息,从而在目标跟踪的准确性上得到显著提升。
-
公开(公告)号:CN117274883B
公开(公告)日:2024-01-26
申请号:CN202311543165.9
申请日:2023-11-20
Applicant: 南昌工程学院
Abstract: 本发明提出一种基于多头注意力优化特征融合网络的目标跟踪方法与系统,该方法包括:在孪生网络框架下构建特征提取网络和特征融合网络模型并进行训练,利用特征提取网络分别对模板图像和搜索图像进行特征提取,得到模板图像特征和搜索区域特征,采用缩小模板图像特征在空间维度上尺度的方式进行多头自注意力计算,得到编码后模板特征,采用搜索区域特征降维的方式进行多头自注意力计算,得到局部特征增强的搜索区域特征,再将二者进行特征融合,将融合结果送入分类分支和回归分支上获取目标在搜索区域的最大响应位置以进行目标跟踪。本发明利用高效自注意力和高效空间约简注(56)对比文件王辰成;杨麟儿;王莹莹;杜永萍;杨尔弘.基于Transformer增强架构的中文语法纠错方法.中文信息学报.2020,(06),全文.Yuanyun Wang.Depthwise Over-parameterized Siamese Network for VisualTracking《. 2021 International Conferenceon Information Technology and BiomedicalEngineering (ICITBE)》.2022,全文.马静怡;崔昊杨.基于改进RPN网络的电力设备图像识别方法研究.供用电.2020,(第01期),全文.
-
公开(公告)号:CN118691852B
公开(公告)日:2024-11-05
申请号:CN202411192503.3
申请日:2024-08-28
Applicant: 南昌工程学院
IPC: G06V10/62 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/75 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06N3/048
Abstract: 本发明提出一种基于双softmax注意力的单流单阶段目标跟踪方法与系统,该方法基于ViT模型,将ViT模型中的编码器替换为基于双softmax注意力的编码器,得到目标跟踪模型,并将模板和搜索区域的图像输入目标跟踪模型,通过双softmax注意力的编码器,对模板图像及搜索区域图像进行统一特征学习,以在模板和搜索区域之间建立自由信息流,得到具有目标导向性的特征信息;并将结果送入预测头分别进行分类和回归操作,以获取目标跟踪结果。本发明融合了线性注意力机制和softmax注意力机制的特性,同时具有较低的计算复杂度和较高的模型表达能力,使跟踪器在降低计算成本的同时实现良好的跟踪性能。
-
公开(公告)号:CN117274883A
公开(公告)日:2023-12-22
申请号:CN202311543165.9
申请日:2023-11-20
Applicant: 南昌工程学院
Abstract: 本发明提出一种基于多头注意力优化特征融合网络的目标跟踪方法与系统,该方法包括:在孪生网络框架下构建特征提取网络和特征融合网络模型并进行训练,利用特征提取网络分别对模板图像和搜索图像进行特征提取,得到模板图像特征和搜索区域特征,采用缩小模板图像特征在空间维度上尺度的方式进行多头自注意力计算,得到编码后模板特征,采用搜索区域特征降维的方式进行多头自注意力计算,得到局部特征增强的搜索区域特征,再将二者进行特征融合,将融合结果送入分类分支和回归分支上获取目标在搜索区域的最大响应位置以进行目标跟踪。本发明利用高效自注意力和高效空间约简注意力构建了特征融合网络,有效地提高了目标跟踪的准确性和鲁棒性。
-
公开(公告)号:CN119741578A
公开(公告)日:2025-04-01
申请号:CN202510240847.5
申请日:2025-03-03
Applicant: 南昌工程学院
IPC: G06V10/80 , G06V10/82 , G06T5/94 , G06T3/4038 , G06N3/0985 , G06N3/0455
Abstract: 本发明提出一种基于紧凑轴向注意力和细节增强的目标跟踪方法与系统,该方法包括:将模板图像和搜索区域图像输入至特征提取网络中进行统一特征学习,得到输出特征图;利用大规模数据集对优化的特征提取网络依次进行预训练和参数调整;将模板图像和搜索区域图像输入至参数调整后的特征提取网络中进行特征提取;将细节融合特征依次进行展平操作和拼接操作,并输入至特征融合模块中进行特征融合;将包含信息的融合特征输入至预测头,获取目标跟踪框,利用目标跟踪模型对目标跟踪框进行跟踪,得到跟踪结果;本发明通过细节增强模块使跟踪器能够在保持全局语义理解的同时,恢复和利用局部细节信息,从而在目标跟踪的准确性上得到显著提升。
-
公开(公告)号:CN119006530A
公开(公告)日:2024-11-22
申请号:CN202411492146.2
申请日:2024-10-24
Applicant: 南昌工程学院
IPC: G06T7/246 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/08 , G06V10/44 , G06V10/766 , G06V10/82 , G06V10/46
Abstract: 本发明提出基于频域块和高效查询注意力的目标跟踪方法与系统,该方法包括:将模板图像输入模板分支模块,通过快速傅里叶变换,再通过门控卷积进行筛选,随后进行逆快速傅里叶变换,得到更新后的模板令牌;将更新后的模板令牌通过高效查询注意力机制处理得到模板特征图;将搜索图像输入搜索分支模块,通过多头自注意力机制生成搜索特征图;将模板特征图与搜索特征图进行拼接再通过多头自注意力机制处理,得到拼接特征图;将拼接特征图输入预测头,根据输出结果对目标进行跟踪。本发明充分结合频域块和高效查询注意力的优势构建基于Transformer的多尺度特征提取网络,使得跟踪器可以实现更准确和鲁棒的跟踪。
-
公开(公告)号:CN118691852A
公开(公告)日:2024-09-24
申请号:CN202411192503.3
申请日:2024-08-28
Applicant: 南昌工程学院
IPC: G06V10/62 , G06V10/25 , G06V10/764 , G06V10/766 , G06V10/75 , G06V10/44 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/09 , G06N3/048
Abstract: 本发明提出一种基于双softmax注意力的单流单阶段目标跟踪方法与系统,该方法基于ViT模型,将ViT模型中的编码器替换为基于双softmax注意力的编码器,得到目标跟踪模型,并将模板和搜索区域的图像输入目标跟踪模型,通过双softmax注意力的编码器,对模板图像及搜索区域图像进行统一特征学习,以在模板和搜索区域之间建立自由信息流,得到具有目标导向性的特征信息;并将结果送入预测头分别进行分类和回归操作,以获取目标跟踪结果。本发明融合了线性注意力机制和softmax注意力机制的特性,同时具有较低的计算复杂度和较高的模型表达能力,使跟踪器在降低计算成本的同时实现良好的跟踪性能。
-
公开(公告)号:CN118015048A
公开(公告)日:2024-05-10
申请号:CN202410417455.7
申请日:2024-04-09
Applicant: 南昌工程学院
IPC: G06T7/246 , G06V10/40 , G06V10/764 , G06V10/774
Abstract: 本发明提出一种基于残差网络和群体混合注意力的目标跟踪方法与系统,该方法包括,采用深度残差网络和群体混合注意力对模板分支以及搜索分支的目标图像特征进行提取,得到模板图像特征和搜索图像特征;再将模板图像特征输入模型预测模块进行训练,得到最优预测模型,再将最优预测模型的权重应用于搜索图像特征,再经过卷积计算出目标置信度分数,确定目标中心位置;利用模板图像特征和初始边界框获取调制向量,再将搜索图像特征、提议边界框以及调制向量输入IoU预测器中,估算每个提议边界框的IoU,以确定与初始边界框重叠最多的提议边界框,即目标的最终边界框。本发明可有效利用目标和背景外观信息,实现高精度和强泛化能力的跟踪。
-
-
-
-
-
-
-
-