基于胶囊网络和自然语言查询的目标跟踪方法

    公开(公告)号:CN113936040A

    公开(公告)日:2022-01-14

    申请号:CN202111204089.X

    申请日:2021-10-15

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于胶囊网络和自然语言查询的目标跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域和相应的文本查询,将搜索区域送入视觉编码器提取视觉的特征表示,将文本查询送入文本编码器提取文本的特征表示;二、利用视觉编码器提取的视觉的特征表示构建视觉胶囊,利用文本编码器提取的文本的特征表示构建文本胶囊,在视觉胶囊和文本胶囊的基础上设计视觉‑文本路由模块和文本‑视觉路由模块;三、将视觉‑文本路由模块和文本‑视觉路由模块的输出进行串联并通过解码器生成目标的响应图。本发明在仅利用自然语言进行初始化跟踪器,就能接近其它方法,同时利用自然语言查询和初始边界框进行初始化的结果,具有良好的鲁棒性。

    基于循环回归网络的快速目标跟踪方法

    公开(公告)号:CN110223316B

    公开(公告)日:2021-01-29

    申请号:CN201910512271.8

    申请日:2019-06-13

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于循环回归网络的快速目标跟踪方法,所述方法包括如下步骤:步骤一、使用ResNet50网络作为回归网络的基本网络;步骤二、在训练完回归网络之后,在其基础上引入LSTM网络形成最终的循环回归网络来捕捉目标在跟踪过程中出现的各种外观变化;步骤三、使用Smooth‑L1损失函数对循环回归网络进行训练。本发明整个过程利用一个神经网络进行目标跟踪,运用深层监督在不同尺度的特征上回归目标框坐标,并使用长短时记忆网络来捕捉目标在跟踪过程中出现的各种外观变化。较现有的目标跟踪方法,在不需要进行在线更新的情况下,就能较为准确的定位目标,具有良好的鲁棒性。

    基于胶囊网络和自然语言查询的目标跟踪方法

    公开(公告)号:CN113936040B

    公开(公告)日:2023-09-15

    申请号:CN202111204089.X

    申请日:2021-10-15

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于胶囊网络和自然语言查询的目标跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域和相应的文本查询,将搜索区域送入视觉编码器提取视觉的特征表示,将文本查询送入文本编码器提取文本的特征表示;二、利用视觉编码器提取的视觉的特征表示构建视觉胶囊,利用文本编码器提取的文本的特征表示构建文本胶囊,在视觉胶囊和文本胶囊的基础上设计视觉‑文本路由模块和文本‑视觉路由模块;三、将视觉‑文本路由模块和文本‑视觉路由模块的输出进行串联并通过解码器生成目标的响应图。本发明在仅利用自然语言进行初始化跟踪器,就能接近其它方法,同时利用自然语言查询和初始边界框进行初始化的结果,具有良好的鲁棒性。

    基于调制器的自适应回归跟踪方法

    公开(公告)号:CN113947618A

    公开(公告)日:2022-01-18

    申请号:CN202111222510.X

    申请日:2021-10-20

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于调制器的自适应回归跟踪方法,所述方法包括如下步骤:步骤一、设计基于注意力的时空上下文网络,生成与时空上下文对应的仿射参数;步骤二、设计轨迹网络,产生与轨迹对应的仿射参数;步骤三、将步骤一和步骤二产生的两种参数融入到通用回归网络的各层参数中,自适应地调整通用回归网络的参数,使其对特定目标具有较高的响应。相比于现有技术,本发明具有如下优点:模型在跟踪过程中不需要效率低下的微调过程;上下文预测网络对过去帧中相关的重要时空背景进行编码,有助于从背景中区分目标;轨迹为当前帧中目标的定位提供了必要的先验知识。

    一种基于级联的上下文感知框架的目标跟踪方法

    公开(公告)号:CN110570450A

    公开(公告)日:2019-12-13

    申请号:CN201910882861.X

    申请日:2019-09-18

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于级联的上下文感知框架的目标跟踪方法,所述方法提出了一个基于两个网络的级联的上下文感知框架,其包括两个子网络:一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构,第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图,可以灵活地生成目标的定位框,有效地区分目标与其周围干扰物等背景信息。本发明所获得的FCA map能够灵活地嵌入到多种跟踪框架中。

    基于循环回归网络的快速目标跟踪方法

    公开(公告)号:CN110223316A

    公开(公告)日:2019-09-10

    申请号:CN201910512271.8

    申请日:2019-06-13

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于循环回归网络的快速目标跟踪方法,所述方法包括如下步骤:步骤一、使用ResNet50网络作为回归网络的基本网络;步骤二、在训练完回归网络之后,在其基础上引入LSTM网络形成最终的循环回归网络来捕捉目标在跟踪过程中出现的各种外观变化;步骤三、使用Smooth-L1损失函数对循环回归网络进行训练。本发明整个过程利用一个神经网络进行目标跟踪,运用深层监督在不同尺度的特征上回归目标框坐标,并使用长短时记忆网络来捕捉目标在跟踪过程中出现的各种外观变化。较现有的目标跟踪方法,在不需要进行在线更新的情况下,就能较为准确的定位目标,具有良好的鲁棒性。

    基于四叉树胶囊的深度回归跟踪方法

    公开(公告)号:CN115965652B

    公开(公告)日:2024-09-03

    申请号:CN202211224736.8

    申请日:2022-10-09

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于四叉树胶囊的深度回归跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域,采用在ImageNet上预训练的VGG‑16网络的conv4‑3和conv5‑3两个特征层作为特征提取器分别提取底层和高层语义表示;二、通过四叉树胶囊模块构造空间胶囊;三、通过多光谱姿态矩阵注意力构造时空胶囊;四、时序胶囊的局部位移;五、将时序胶囊的姿态矩阵压平,并将它们传递给解码器进行解码。本发明利用搜索区域作为输入,提出利用四叉树胶囊架构构建目标与其上下文之间的时空关系。与现有基于胶囊网络的跟踪器相比,在鲁棒跟踪结果的同时,运行速度达到了43FPS,使得基于胶囊网络的跟踪器首次达到了实时处理。

    基于背景修复和胶囊网络的目标跟踪方法

    公开(公告)号:CN113971686B

    公开(公告)日:2024-05-31

    申请号:CN202111250528.0

    申请日:2021-10-26

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于背景修复和胶囊网络的目标跟踪方法,所述方法包括如下步骤:一、构建背景胶囊表示;二、构建目标胶囊;三、设计背景‑目标胶囊路由算法,获得背景‑目标胶囊表示;四、将背景‑目标路由胶囊的大小调整为36×36×64,然后通过3个反卷积操作将这些特征进行放大处理,最后得到与输入大小相同的288×288×1的背景响应图,通过对其进行取反操作,得到目标的响应图;五、将背景胶囊表示通过一个反卷积层调整到36×36×64,之后通过3个反卷积层,每层对应的核大小为3×3,逐步将36×36×64大小的特征放大到288×288×3,生成3通道的背景修复图像。本发明将目标跟踪的关注点从目标自身转移至对目标与背景差异的刻画,规避了单一外观模型无法应对目标各种外观变化的缺陷。

    一种基于级联的上下文感知框架的目标跟踪方法

    公开(公告)号:CN110570450B

    公开(公告)日:2023-03-24

    申请号:CN201910882861.X

    申请日:2019-09-18

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于级联的上下文感知框架的目标跟踪方法,所述方法提出了一个基于两个网络的级联的上下文感知框架,其包括两个子网络:一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构,第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图,可以灵活地生成目标的定位框,有效地区分目标与其周围干扰物等背景信息。本发明所获得的FCA map能够灵活地嵌入到多种跟踪框架中。

Patent Agency Ranking