基于背景修复和胶囊网络的目标跟踪方法

    公开(公告)号:CN113971686B

    公开(公告)日:2024-05-31

    申请号:CN202111250528.0

    申请日:2021-10-26

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于背景修复和胶囊网络的目标跟踪方法,所述方法包括如下步骤:一、构建背景胶囊表示;二、构建目标胶囊;三、设计背景‑目标胶囊路由算法,获得背景‑目标胶囊表示;四、将背景‑目标路由胶囊的大小调整为36×36×64,然后通过3个反卷积操作将这些特征进行放大处理,最后得到与输入大小相同的288×288×1的背景响应图,通过对其进行取反操作,得到目标的响应图;五、将背景胶囊表示通过一个反卷积层调整到36×36×64,之后通过3个反卷积层,每层对应的核大小为3×3,逐步将36×36×64大小的特征放大到288×288×3,生成3通道的背景修复图像。本发明将目标跟踪的关注点从目标自身转移至对目标与背景差异的刻画,规避了单一外观模型无法应对目标各种外观变化的缺陷。

    基于级联卷积网络和对抗学习的显著性目标检测方法

    公开(公告)号:CN109829391B

    公开(公告)日:2023-04-07

    申请号:CN201910024728.0

    申请日:2019-01-10

    Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。

    一种基于级联的上下文感知框架的目标跟踪方法

    公开(公告)号:CN110570450B

    公开(公告)日:2023-03-24

    申请号:CN201910882861.X

    申请日:2019-09-18

    Inventor: 邬向前 卜巍 马丁

    Abstract: 本发明公开了一种基于级联的上下文感知框架的目标跟踪方法,所述方法提出了一个基于两个网络的级联的上下文感知框架,其包括两个子网络:一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构,第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图,可以灵活地生成目标的定位框,有效地区分目标与其周围干扰物等背景信息。本发明所获得的FCA map能够灵活地嵌入到多种跟踪框架中。

    基于级联卷积网络和对抗学习的显著性目标检测方法

    公开(公告)号:CN109829391A

    公开(公告)日:2019-05-31

    申请号:CN201910024728.0

    申请日:2019-01-10

    Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。

    一种实时击键压力采集系统

    公开(公告)号:CN102389317B

    公开(公告)日:2016-02-10

    申请号:CN201110196411.9

    申请日:2011-07-14

    Abstract: 本发明提供一种实时击键压力采集系统。它是由压力传感器和接口电路组成的,压力传感器连接接口电路,压力传感器使用四个应变片组成一个惠斯通全桥电路,将电阻的变化转换为电压的变化再进行采集;压力传感器安装在标准键盘的底部,包括键帽和回弹装置,接口电路包括放大器、多路复选器、模数转换器和主控制器,模数转换器将选通的模拟信号数字化,主控制器负责整个硬件电路的控制及与计算机通信,采用89SC52作为主控单元,其内置的串口控制器可以方便的与计算机进行通信。本发明在不改变用户接口的情况下实时采集击键压力,使用普通键盘作为用户接口,克服了使用特殊键盘容易造成用户击键习惯改变的缺点,这对于身份识别意义重大。

    基于迭代随机抽样一致性算法和局部掌纹描述符的非接触掌纹认证方法

    公开(公告)号:CN103793705A

    公开(公告)日:2014-05-14

    申请号:CN201410087806.9

    申请日:2014-03-11

    Abstract: 本发明提供了一种基于迭代随机抽样一致性算法和局部掌纹描述符的非接触掌纹认证方法,分为注册和认证两个阶段。本发明使用基于圆形Gabor滤波器的掌纹ROI图像预处理方法;在预处理后的掌纹ROI图像上提取SIFT特征并进行匹配,得到匹配SIFT特征点;使用迭代随机抽样一致性算法去除错误匹配的SIFT特征点;使用局部掌纹描述符进一步去除错误匹配的SIFT特征点;将最终剩余的SIFT特征点的数目作为匹配度,进行决策。本发明提高了非接触式掌纹识别的精度。

    一种舌色还原色卡的制作方法

    公开(公告)号:CN101947101A

    公开(公告)日:2011-01-19

    申请号:CN201010226642.5

    申请日:2010-07-15

    Abstract: 本发明提供一种提高舌色还原效果、使得舌数字图像能更确切的反映舌头真实颜色的舌色还原色卡的制作方法。利用标准24色块的Munsell色卡和一个稳定的舌图像采集环境,采集舌图像,以此为依据确定舌色还原专用色卡的颜色标准值;每个色卡中的色块按一定位置放置在色卡上,色卡也按一定的方式放置在图像采集传感器前,并以该次采集的图像为依据,确定舌色还原专用色卡的颜色标准值,根据这些颜色标准值定制该次的舌色还原专用色卡;本发明根据舌色还原的特殊要求而专门定制色卡中色块的标准值,其确定方法有根据、科学性强,能够极大的提高舌色还原的效果,使得舌数字图像能更确切的反映舌头的真实颜色。

    基于差分运算的高精度掌纹识别方法

    公开(公告)号:CN1924891A

    公开(公告)日:2007-03-07

    申请号:CN200610010548.X

    申请日:2006-09-15

    Abstract: 本发明提供的是一种基于差分运算的高精度掌纹识别方法。它包括(1)掌纹图像预处理;(2)特征提取-建立掌纹差分编码PDC;(3)掌纹匹配。本发明通过差分运算来描述图像灰度的变化。首先,利用二维高斯滤波器对掌纹图像进行平滑。然后,对平滑后的图像进行两次差分运算。最后,根据差分结果的正负符号对掌纹进行编码。这种编码称为palmprint differential code(PDC)。PDC算法能够有效地区分不同的掌纹,是一种实时的高精度身份识别方法,其识别精度比目前最好的掌纹识别方法还高出很多。

    基于自然语言描述和协同全局-局部视角学习的目标追踪方法

    公开(公告)号:CN119559548A

    公开(公告)日:2025-03-04

    申请号:CN202411605976.1

    申请日:2024-11-12

    Inventor: 马丁 邬向前 卜巍

    Abstract: 本发明公开了一种基于自然语言描述和协同全局‑局部视角学习的目标追踪方法,所述方法包括如下步骤:步骤1、输入视频帧的特征提取与初步处理;步骤2、全局和局部分支视觉特征的提取;步骤3、多模态特征对齐实现信息互补和一致性表达;步骤4、对称注意力操作选择重要信息;步骤5、通过预测模块估计目标的位置;步骤6、追踪模型优化。本发明通过全局与局部特征的协同建模、多模态对齐机制以及对称注意力的特征增强,显著提升了目标追踪的精度和鲁棒性,解决了现有技术中全局与局部信息融合不充分、视觉与语言特征对齐能力不足的问题。本发明能够在复杂场景和自然语言描述的条件下精准定位目标,并在多个具有自然语言标注的目标追踪数据集上展现了卓越的性能。

    基于注意力机制和自蒸馏的手持器械细粒度定位方法

    公开(公告)号:CN119540513A

    公开(公告)日:2025-02-28

    申请号:CN202411664240.1

    申请日:2024-11-20

    Abstract: 本发明公开了一种基于注意力机制和自蒸馏的手持器械细粒度定位方法,所述方法通过引入特征融合模块、双重注意力模块以及自蒸馏机制,解决了现有技术中多尺度特征融合不足、器械边界模糊和干扰区域识别不准确的问题。具体而言,特征融合模块则对不同尺度的特征图进行有效融合,以获取更为精确的全局与局部信息;双重注意力模块通过结合通道注意力与位置注意力,进一步增强对复杂手术场景中器械特征的捕捉能力;自蒸馏机制则通过跨层知识传播提高定位模型的精度,尤其是在保持轻量化模型结构的前提下,显著优化了定位性能。本发明不仅提升了模型对复杂语义关系的理解能力,还在器械的细节定位和干扰区域的准确识别方面取得了显著进步。

Patent Agency Ranking