-
公开(公告)号:CN113656539A
公开(公告)日:2021-11-16
申请号:CN202110859387.6
申请日:2021-07-28
Applicant: 哈尔滨工业大学
IPC: G06F16/33 , G06F16/383 , G06F16/53 , G06F16/583 , G06N3/04 , G06N3/08 , G06N20/20
Abstract: 本发明公开了一种基于特征分离和重建的跨模态检索方法,所述方法包括如下步骤:步骤一、获得视觉表示;步骤二、将单词序列转化为文本表示;步骤三、通过视觉和文本多层感知器进行线性变换,分别得到视觉空间和文本空间的特征向量;步骤四、将不同模态空间的特征向量分解为模态信息、语义信息、特定信息三部分;步骤五、利用特征分离模块将模态信息、语义信息和特定信息从视觉/文本表示中分离出来,得到视觉表示和文本表示的模态信息、语义信息和特定信息;步骤六、结合图像三种不同的信息进行图像重建;步骤七、对文本三种不同的信息进行文本重建。本发明的方法可以很好地进行跨模态检索,并在多个数据库上取得了具有竞争力的结果。
-
公开(公告)号:CN110223316B
公开(公告)日:2021-01-29
申请号:CN201910512271.8
申请日:2019-06-13
Applicant: 哈尔滨工业大学
IPC: G06T7/20
Abstract: 本发明公开了一种基于循环回归网络的快速目标跟踪方法,所述方法包括如下步骤:步骤一、使用ResNet50网络作为回归网络的基本网络;步骤二、在训练完回归网络之后,在其基础上引入LSTM网络形成最终的循环回归网络来捕捉目标在跟踪过程中出现的各种外观变化;步骤三、使用Smooth‑L1损失函数对循环回归网络进行训练。本发明整个过程利用一个神经网络进行目标跟踪,运用深层监督在不同尺度的特征上回归目标框坐标,并使用长短时记忆网络来捕捉目标在跟踪过程中出现的各种外观变化。较现有的目标跟踪方法,在不需要进行在线更新的情况下,就能较为准确的定位目标,具有良好的鲁棒性。
-
公开(公告)号:CN103793705B
公开(公告)日:2018-03-30
申请号:CN201410087806.9
申请日:2014-03-11
Applicant: 哈尔滨工业大学
IPC: G06K9/00
Abstract: 本发明提供了一种基于迭代随机抽样一致性算法和局部掌纹描述符的非接触掌纹认证方法,分为注册和认证两个阶段。本发明使用基于圆形Gabor滤波器的掌纹ROI图像预处理方法;在预处理后的掌纹ROI图像上提取SIFT特征并进行匹配,得到匹配SIFT特征点;使用迭代随机抽样一致性算法去除错误匹配的SIFT特征点;使用局部掌纹描述符进一步去除错误匹配的SIFT特征点;将最终剩余的SIFT特征点的数目作为匹配度,进行决策。本发明提高了非接触式掌纹识别的精度。
-
公开(公告)号:CN106228566A
公开(公告)日:2016-12-14
申请号:CN201610669791.6
申请日:2016-08-15
Applicant: 哈尔滨工业大学
IPC: G06T7/00
CPC classification number: G06T7/0012 , G06T2207/30041
Abstract: 基于梯度响亮分析的视网膜微动脉瘤的自动检测与识别方法,视网膜微动脉瘤的自动检测与识别方法。所述的方法包括如下步骤:步骤一:候选微动脉瘤检测;先对微动脉瘤提取,所述的微动脉瘤提取主要包含血管去除、候选微动脉瘤定位与分割三个步骤;步骤二:候选微动脉瘤特征的提取;步骤三:微动脉瘤识别。本发明通过分析眼底视网膜图像中不同暗目标的梯度向量分布情况,并结合样本不均衡分类器,提出了新的视网膜微动脉瘤的自动检测与识别方法。
-
公开(公告)号:CN106157319A
公开(公告)日:2016-11-23
申请号:CN201610604732.0
申请日:2016-07-28
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6218 , G06K9/46 , G06N3/04 , G06T2207/20084 , G06T2207/20221
Abstract: 本发明公开了一种基于卷积神经网络的区域和像素级融合的显著性检测方法,该方法研究的对象是静态图像,其中图像的内容可以是任意的,研究的目标是从图像中找出吸引人眼注意力的目标,并为其赋予不同的显著性值。本发明主要提出了一种自适应的区域生成技术,并设计了两个CNN网络结构,分别用于像素级显著性预测和显著性融合。这两个CNN网络模型以图像作为输入,以图像的真实结果作为监督信号用于网络模型的训练,并最终输出与输入图像大小一致的显著性图。本发明能有效地进行区域级显著性估计和像素级显著性预测,得到两个显著性图,最后使用进行显著性融合的CNN将两个显著性图及原始图像进行融合得到最终的显著性图。
-
公开(公告)号:CN103400130B
公开(公告)日:2016-07-20
申请号:CN201310321375.3
申请日:2013-07-22
Applicant: 哈尔滨工业大学
IPC: G06K9/32
Abstract: 本发明提出了一种基于能量最小化框架的文档图像倾斜度检测和纠正方法,该方法的研究对象为机打文档图像,文档图像中的内容可以是文字、表格、图片等。本发明首先需要使用扫描仪将文档扫描成电子文档图像,然后估算前景像素状态信息,然后利用前景像素状态信息构建能量函数,然后利用图像处理技术和直线拟合技术计算初始的倾斜度,最后进行能量最小化过程得到最终的倾斜度并将文档图像进行纠正。本发明能适用于多种不同类型的文档,使得倾斜度检测更加精确,在保证精度的同时也提高了倾斜度检测的速度。
-
公开(公告)号:CN102622596B
公开(公告)日:2016-07-20
申请号:CN201210037532.3
申请日:2012-02-20
Applicant: 哈尔滨工业大学
Abstract: 一种面向生物特征识别的交互式定位方法,包括以下步骤:1、交互式定义虚拟关键点;2、根据虚拟关键点采集图像。该方法根据被采集部位的特点,在注册时用户自定义虚拟关键点所在的位置,然后系统保存用户定义的关键点的位置,为该用户在以后的每次图像采集中提供参考。在保证关键点定位准确性的同时,最大限度地保证了用户友好性。同时减少了对准的难度和时间,提高了系统性能。
-
公开(公告)号:CN102622596A
公开(公告)日:2012-08-01
申请号:CN201210037532.3
申请日:2012-02-20
Applicant: 哈尔滨工业大学
Abstract: 一种面向生物特征识别的交互式定位方法,包括以下步骤:1、交互式定义虚拟关键点;2、根据虚拟关键点采集图像。该方法根据被采集部位的特点,在注册时用户自定义虚拟关键点所在的位置,然后系统保存用户定义的关键点的位置,为该用户在以后的每次图像采集中提供参考。在保证关键点定位准确性的同时,最大限度地保证了用户友好性。同时减少了对准的难度和时间,提高了系统性能。
-
-
-
-
-
-
-