-
公开(公告)号:CN103400130A
公开(公告)日:2013-11-20
申请号:CN201310321375.3
申请日:2013-07-22
Applicant: 哈尔滨工业大学
IPC: G06K9/32
Abstract: 本发明提出了一种基于能量最小化框架的文档图像倾斜度检测和纠正方法,该方法的研究对象为机打文档图像,文档图像中的内容可以是文字、表格、图片等。本发明首先需要使用扫描仪将文档扫描成电子文档图像,然后估算前景像素状态信息,然后利用前景像素状态信息构建能量函数,然后利用图像处理技术和直线拟合技术计算初始的倾斜度,最后进行能量最小化过程得到最终的倾斜度并将文档图像进行纠正。本发明能适用于多种不同类型的文档,使得倾斜度检测更加精确,在保证精度的同时也提高了倾斜度检测的速度。
-
公开(公告)号:CN101093626A
公开(公告)日:2007-12-26
申请号:CN200710072581.X
申请日:2007-07-27
Applicant: 哈尔滨工业大学
Abstract: 本发明提供了一种掌纹密钥系统,该系统直接以掌纹的编码作为信息加解密的密钥。在加密阶段,首先对采集到的掌纹图像进行差分运算,提取出一个1024位的二进制串,然后应用Hash运算将其转换成128位加密密钥(用于对信息加密),同时,生成该二进制串的纠错码(ECC)。在解密阶段,利用差分运算从新输入的掌纹图像中提取1024位的二进制串,接着用纠错码(ECC)对该二进制串进行纠错,然后通过Hash运算生成解密密钥。实验结果表明,本系统的精确性和安全性可以满足大部分应用的需要。
-
公开(公告)号:CN113947618B
公开(公告)日:2023-08-29
申请号:CN202111222510.X
申请日:2021-10-20
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06N3/0464 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种基于调制器的自适应回归跟踪方法,所述方法包括如下步骤:步骤一、设计基于注意力的时空上下文网络,生成与时空上下文对应的仿射参数;步骤二、设计轨迹网络,产生与轨迹对应的仿射参数;步骤三、将步骤一和步骤二产生的两种参数融入到通用回归网络的各层参数中,自适应地调整通用回归网络的参数,使其对特定目标具有较高的响应。相比于现有技术,本发明具有如下优点:模型在跟踪过程中不需要效率低下的微调过程;上下文预测网络对过去帧中相关的重要时空背景进行编码,有助于从背景中区分目标;轨迹为当前帧中目标的定位提供了必要的先验知识。
-
公开(公告)号:CN115965652A
公开(公告)日:2023-04-14
申请号:CN202211224736.8
申请日:2022-10-09
Applicant: 哈尔滨工业大学
IPC: G06T7/246 , G06T9/40 , G06V10/764 , G06V10/77 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种基于四叉树胶囊的深度回归跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域,采用在ImageNet上预训练的VGG‑16网络的conv4‑3和conv5‑3两个特征层作为特征提取器分别提取底层和高层语义表示;二、通过四叉树胶囊模块构造空间胶囊;三、通过多光谱姿态矩阵注意力构造时空胶囊;四、时序胶囊的局部位移;五、将时序胶囊的姿态矩阵压平,并将它们传递给解码器进行解码。本发明利用搜索区域作为输入,提出利用四叉树胶囊架构构建目标与其上下文之间的时空关系。与现有基于胶囊网络的跟踪器相比,在鲁棒跟踪结果的同时,运行速度达到了43FPS,使得基于胶囊网络的跟踪器首次达到了实时处理。
-
公开(公告)号:CN115565007A
公开(公告)日:2023-01-03
申请号:CN202211240066.9
申请日:2022-10-11
Applicant: 哈尔滨工业大学
IPC: G06V10/764 , G06V10/74 , G06V10/774 , G06F40/30
Abstract: 本发明公开了一种基于知识蒸馏的隐空间语义监督的跨模态检索方法,整个网络的总体结构大体上可以分成四个部分:第一个部分:多模态特征提取网络,第二个部分:图像和文本隐空间的构建,第三个部分:基于知识蒸馏的隐空间语义监督,第四个部分:图像文本匹配。本发明将BUA中的目标分类器和属性分类器引入图像隐空间,通过知识蒸馏将BUA中的语义知识转移到图像隐空间中。本发明在文本隐空间中引入目标和属性分类器,使文本特征和相应的文本上下文特征保持一致。本发明的方法可以很好地进行跨模态检索,并在多个数据库上取得了具有竞争力的结果。
-
公开(公告)号:CN113971686A
公开(公告)日:2022-01-25
申请号:CN202111250528.0
申请日:2021-10-26
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于背景修复和胶囊网络的目标跟踪方法,所述方法包括如下步骤:一、构建背景胶囊表示;二、构建目标胶囊;三、设计背景‑目标胶囊路由算法,获得背景‑目标胶囊表示;四、将背景‑目标路由胶囊的大小调整为36×36×64,然后通过3个反卷积操作将这些特征进行放大处理,最后得到与输入大小相同的288×288×1的背景响应图,通过对其进行取反操作,得到目标的响应图;五、将背景胶囊表示通过一个反卷积层调整到36×36×64,之后通过3个反卷积层,每层对应的核大小为3×3,逐步将36×36×64大小的特征放大到288×288×3,生成3通道的背景修复图像。本发明将目标跟踪的关注点从目标自身转移至对目标与背景差异的刻画,规避了单一外观模型无法应对目标各种外观变化的缺陷。
-
公开(公告)号:CN113936040A
公开(公告)日:2022-01-14
申请号:CN202111204089.X
申请日:2021-10-15
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于胶囊网络和自然语言查询的目标跟踪方法,所述方法包括如下步骤:一、给定当前帧的搜索区域和相应的文本查询,将搜索区域送入视觉编码器提取视觉的特征表示,将文本查询送入文本编码器提取文本的特征表示;二、利用视觉编码器提取的视觉的特征表示构建视觉胶囊,利用文本编码器提取的文本的特征表示构建文本胶囊,在视觉胶囊和文本胶囊的基础上设计视觉‑文本路由模块和文本‑视觉路由模块;三、将视觉‑文本路由模块和文本‑视觉路由模块的输出进行串联并通过解码器生成目标的响应图。本发明在仅利用自然语言进行初始化跟踪器,就能接近其它方法,同时利用自然语言查询和初始边界框进行初始化的结果,具有良好的鲁棒性。
-
公开(公告)号:CN113656539A
公开(公告)日:2021-11-16
申请号:CN202110859387.6
申请日:2021-07-28
Applicant: 哈尔滨工业大学
IPC: G06F16/33 , G06F16/383 , G06F16/53 , G06F16/583 , G06N3/04 , G06N3/08 , G06N20/20
Abstract: 本发明公开了一种基于特征分离和重建的跨模态检索方法,所述方法包括如下步骤:步骤一、获得视觉表示;步骤二、将单词序列转化为文本表示;步骤三、通过视觉和文本多层感知器进行线性变换,分别得到视觉空间和文本空间的特征向量;步骤四、将不同模态空间的特征向量分解为模态信息、语义信息、特定信息三部分;步骤五、利用特征分离模块将模态信息、语义信息和特定信息从视觉/文本表示中分离出来,得到视觉表示和文本表示的模态信息、语义信息和特定信息;步骤六、结合图像三种不同的信息进行图像重建;步骤七、对文本三种不同的信息进行文本重建。本发明的方法可以很好地进行跨模态检索,并在多个数据库上取得了具有竞争力的结果。
-
公开(公告)号:CN110223316B
公开(公告)日:2021-01-29
申请号:CN201910512271.8
申请日:2019-06-13
Applicant: 哈尔滨工业大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于循环回归网络的快速目标跟踪方法,所述方法包括如下步骤:步骤一、使用ResNet50网络作为回归网络的基本网络;步骤二、在训练完回归网络之后,在其基础上引入LSTM网络形成最终的循环回归网络来捕捉目标在跟踪过程中出现的各种外观变化;步骤三、使用Smooth‑L1损失函数对循环回归网络进行训练。本发明整个过程利用一个神经网络进行目标跟踪,运用深层监督在不同尺度的特征上回归目标框坐标,并使用长短时记忆网络来捕捉目标在跟踪过程中出现的各种外观变化。较现有的目标跟踪方法,在不需要进行在线更新的情况下,就能较为准确的定位目标,具有良好的鲁棒性。
-
公开(公告)号:CN103793705B
公开(公告)日:2018-03-30
申请号:CN201410087806.9
申请日:2014-03-11
Applicant: 哈尔滨工业大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于迭代随机抽样一致性算法和局部掌纹描述符的非接触掌纹认证方法,分为注册和认证两个阶段。本发明使用基于圆形Gabor滤波器的掌纹ROI图像预处理方法;在预处理后的掌纹ROI图像上提取SIFT特征并进行匹配,得到匹配SIFT特征点;使用迭代随机抽样一致性算法去除错误匹配的SIFT特征点;使用局部掌纹描述符进一步去除错误匹配的SIFT特征点;将最终剩余的SIFT特征点的数目作为匹配度,进行决策。本发明提高了非接触式掌纹识别的精度。
-
-
-
-
-
-
-
-
-