-
公开(公告)号:CN119559548A
公开(公告)日:2025-03-04
申请号:CN202411605976.1
申请日:2024-11-12
Applicant: 哈尔滨工业大学
IPC: G06V20/40 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/048
Abstract: 本发明公开了一种基于自然语言描述和协同全局‑局部视角学习的目标追踪方法,所述方法包括如下步骤:步骤1、输入视频帧的特征提取与初步处理;步骤2、全局和局部分支视觉特征的提取;步骤3、多模态特征对齐实现信息互补和一致性表达;步骤4、对称注意力操作选择重要信息;步骤5、通过预测模块估计目标的位置;步骤6、追踪模型优化。本发明通过全局与局部特征的协同建模、多模态对齐机制以及对称注意力的特征增强,显著提升了目标追踪的精度和鲁棒性,解决了现有技术中全局与局部信息融合不充分、视觉与语言特征对齐能力不足的问题。本发明能够在复杂场景和自然语言描述的条件下精准定位目标,并在多个具有自然语言标注的目标追踪数据集上展现了卓越的性能。
-
公开(公告)号:CN119540513A
公开(公告)日:2025-02-28
申请号:CN202411664240.1
申请日:2024-11-20
Applicant: 哈尔滨工业大学
IPC: G06V10/22 , G06T3/4007 , G06V10/80 , G06T3/4038 , G06V10/74 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制和自蒸馏的手持器械细粒度定位方法,所述方法通过引入特征融合模块、双重注意力模块以及自蒸馏机制,解决了现有技术中多尺度特征融合不足、器械边界模糊和干扰区域识别不准确的问题。具体而言,特征融合模块则对不同尺度的特征图进行有效融合,以获取更为精确的全局与局部信息;双重注意力模块通过结合通道注意力与位置注意力,进一步增强对复杂手术场景中器械特征的捕捉能力;自蒸馏机制则通过跨层知识传播提高定位模型的精度,尤其是在保持轻量化模型结构的前提下,显著优化了定位性能。本发明不仅提升了模型对复杂语义关系的理解能力,还在器械的细节定位和干扰区域的准确识别方面取得了显著进步。
-
公开(公告)号:CN117314959A
公开(公告)日:2023-12-29
申请号:CN202311186980.4
申请日:2023-09-14
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06V20/40 , G06V10/764 , G06V10/766 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/08
Abstract: 一种基于长短时上下文解耦和自然语言查询的目标跟踪方法,所述方法包括如下步骤:步骤一、使用在ImageNet数据集上预训练的ResNet网络和Transfomer结构的编码器提取视频帧级特征;步骤二、拼接视频帧级特征获得视频级特征;步骤三、使用文本编码器获得文本查询特征;步骤四、通过短时上下文匹配分支捕捉动态上下文信息;步骤五、通过长时上下文感知分支捕捉静态上下文信息;步骤六、通过长短时调制模块自适应地调控所需的长时或短时上下文信息;步骤七、通过预测模块估计目标的位置;步骤八、模型优化。较现有的基于自然语言查询的目标跟踪方法,本发明的目标定位的准确度取得了显著提高,展现了良好的跟踪鲁棒性。
-
公开(公告)号:CN113963022B
公开(公告)日:2023-08-18
申请号:CN202111221017.6
申请日:2021-10-20
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06N3/096 , G06N3/0464
Abstract: 本发明公开了一种基于知识蒸馏的多出口全卷积网络的目标跟踪方法,所述方法包括如下步骤:步骤一、构建基于知识蒸馏的多出口全卷积网络;步骤二、基于知识蒸馏的多出口训练。本发明提出了一种基于知识蒸馏的多出口全卷积结构用于基于分类的跟踪,凭借知识蒸馏的优势,鼓励前序出口模仿学习后续出口的概率输出,从而提高前序出口的判别能力。本发明通过利用多个RoIAlign层来提取不同尺度的区域特征,并在每个出口融合以上区域特征来提高判别能力。本发明使用不同种类的注意力模块来捕获不同的目标特定信息,提高了目标与背景及其干扰物区分能力。本发明在取得更高的跟踪精度的同时,还拥有相对较快的处理速度。
-
公开(公告)号:CN115436002A
公开(公告)日:2022-12-06
申请号:CN202211295961.0
申请日:2022-10-21
Applicant: 哈尔滨工业大学重庆研究院
Abstract: 本发明提出了一种用于测试燃料电池动力系统的风洞测试平台,涉及燃料电池动力系统技术领域。一种用于测试燃料电池动力系统的风洞测试平台,其包括风洞装置、信息采集模块和控制模块,信息采集模块与控制模块连接。风洞装置用于为燃料电池动力系统提供可调节风速的连续气流。控制模块用于调整燃料电池动力系统的物理参数。基于物理参数,信息采集模块用于采集风洞装置的风速信息和燃料电池动力系统的测试信息,并将风速信息和测试信息传输至控制模块。控制模块还用于根据风速信息和测试信息进行数据分析和反馈。从而实现了测试在不同风速条件下燃料电池动力系统的稳定性和压力及其他物理参数的目的。
-
公开(公告)号:CN113963022A
公开(公告)日:2022-01-21
申请号:CN202111221017.6
申请日:2021-10-20
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于知识蒸馏的多出口全卷积网络的目标跟踪方法,所述方法包括如下步骤:步骤一、构建基于知识蒸馏的多出口全卷积网络;步骤二、基于知识蒸馏的多出口训练。本发明提出了一种基于知识蒸馏的多出口全卷积结构用于基于分类的跟踪,凭借知识蒸馏的优势,鼓励前序出口模仿学习后续出口的概率输出,从而提高前序出口的判别能力。本发明通过利用多个RoIAlign层来提取不同尺度的区域特征,并在每个出口融合以上区域特征来提高判别能力。本发明使用不同种类的注意力模块来捕获不同的目标特定信息,提高了目标与背景及其干扰物区分能力。本发明在取得更高的跟踪精度的同时,还拥有相对较快的处理速度。
-
公开(公告)号:CN113936040B
公开(公告)日:2023-09-15
申请号:CN202111204089.X
申请日:2021-10-15
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06V10/82 , G06V10/764 , G06F16/33 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于胶囊网络和自然语言查询的目标跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域和相应的文本查询,将搜索区域送入视觉编码器提取视觉的特征表示,将文本查询送入文本编码器提取文本的特征表示;二、利用视觉编码器提取的视觉的特征表示构建视觉胶囊,利用文本编码器提取的文本的特征表示构建文本胶囊,在视觉胶囊和文本胶囊的基础上设计视觉‑文本路由模块和文本‑视觉路由模块;三、将视觉‑文本路由模块和文本‑视觉路由模块的输出进行串联并通过解码器生成目标的响应图。本发明在仅利用自然语言进行初始化跟踪器,就能接近其它方法,同时利用自然语言查询和初始边界框进行初始化的结果,具有良好的鲁棒性。
-
公开(公告)号:CN113947618A
公开(公告)日:2022-01-18
申请号:CN202111222510.X
申请日:2021-10-20
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于调制器的自适应回归跟踪方法,所述方法包括如下步骤:步骤一、设计基于注意力的时空上下文网络,生成与时空上下文对应的仿射参数;步骤二、设计轨迹网络,产生与轨迹对应的仿射参数;步骤三、将步骤一和步骤二产生的两种参数融入到通用回归网络的各层参数中,自适应地调整通用回归网络的参数,使其对特定目标具有较高的响应。相比于现有技术,本发明具有如下优点:模型在跟踪过程中不需要效率低下的微调过程;上下文预测网络对过去帧中相关的重要时空背景进行编码,有助于从背景中区分目标;轨迹为当前帧中目标的定位提供了必要的先验知识。
-
公开(公告)号:CN110570450A
公开(公告)日:2019-12-13
申请号:CN201910882861.X
申请日:2019-09-18
Applicant: 哈尔滨工业大学
IPC: G06T7/207
Abstract: 本发明公开了一种基于级联的上下文感知框架的目标跟踪方法,所述方法提出了一个基于两个网络的级联的上下文感知框架,其包括两个子网络:一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构,第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图,可以灵活地生成目标的定位框,有效地区分目标与其周围干扰物等背景信息。本发明所获得的FCA map能够灵活地嵌入到多种跟踪框架中。
-
公开(公告)号:CN110223316A
公开(公告)日:2019-09-10
申请号:CN201910512271.8
申请日:2019-06-13
Applicant: 哈尔滨工业大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于循环回归网络的快速目标跟踪方法,所述方法包括如下步骤:步骤一、使用ResNet50网络作为回归网络的基本网络;步骤二、在训练完回归网络之后,在其基础上引入LSTM网络形成最终的循环回归网络来捕捉目标在跟踪过程中出现的各种外观变化;步骤三、使用Smooth-L1损失函数对循环回归网络进行训练。本发明整个过程利用一个神经网络进行目标跟踪,运用深层监督在不同尺度的特征上回归目标框坐标,并使用长短时记忆网络来捕捉目标在跟踪过程中出现的各种外观变化。较现有的目标跟踪方法,在不需要进行在线更新的情况下,就能较为准确的定位目标,具有良好的鲁棒性。
-
-
-
-
-
-
-
-
-