-
公开(公告)号:CN109829391B
公开(公告)日:2023-04-07
申请号:CN201910024728.0
申请日:2019-01-10
Applicant: 哈尔滨工业大学
IPC: G06V20/00 , G06V10/46 , G06V10/82 , G06N3/0464 , G06N3/045 , G06N3/0475 , G06N3/094 , G06N3/09
Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
公开(公告)号:CN109829391A
公开(公告)日:2019-05-31
申请号:CN201910024728.0
申请日:2019-01-10
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于级联卷积网络和对抗学习的显著性目标检测方法,所述方法包括如下步骤:一、设计全局显著性估计器E;二、设计局部显著性细化器R;三、将全局显著性估计器E和局部显著性细化器R组合成为基于级联卷积神经网络的产生器G,用于生成显著性图;四、优化产生器G;五、设计对抗学习判别器D来区分真实的显著性图和产生器G生成的预测显著性图;六、产生器G和对抗学习判别器D遵循CGAN的策略,以一种完全端到端的方式进行训练,使产生器G更好地了解显著性物体结构信息,得到好的显著性检测结果。本发明通过对抗学习隐式学习这些结构信息,可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
公开(公告)号:CN106157319A
公开(公告)日:2016-11-23
申请号:CN201610604732.0
申请日:2016-07-28
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/6218 , G06K9/46 , G06N3/04 , G06T2207/20084 , G06T2207/20221
Abstract: 本发明公开了一种基于卷积神经网络的区域和像素级融合的显著性检测方法,该方法研究的对象是静态图像,其中图像的内容可以是任意的,研究的目标是从图像中找出吸引人眼注意力的目标,并为其赋予不同的显著性值。本发明主要提出了一种自适应的区域生成技术,并设计了两个CNN网络结构,分别用于像素级显著性预测和显著性融合。这两个CNN网络模型以图像作为输入,以图像的真实结果作为监督信号用于网络模型的训练,并最终输出与输入图像大小一致的显著性图。本发明能有效地进行区域级显著性估计和像素级显著性预测,得到两个显著性图,最后使用进行显著性融合的CNN将两个显著性图及原始图像进行融合得到最终的显著性图。
-
公开(公告)号:CN103400130B
公开(公告)日:2016-07-20
申请号:CN201310321375.3
申请日:2013-07-22
Applicant: 哈尔滨工业大学
IPC: G06K9/32
Abstract: 本发明提出了一种基于能量最小化框架的文档图像倾斜度检测和纠正方法,该方法的研究对象为机打文档图像,文档图像中的内容可以是文字、表格、图片等。本发明首先需要使用扫描仪将文档扫描成电子文档图像,然后估算前景像素状态信息,然后利用前景像素状态信息构建能量函数,然后利用图像处理技术和直线拟合技术计算初始的倾斜度,最后进行能量最小化过程得到最终的倾斜度并将文档图像进行纠正。本发明能适用于多种不同类型的文档,使得倾斜度检测更加精确,在保证精度的同时也提高了倾斜度检测的速度。
-
公开(公告)号:CN103279770A
公开(公告)日:2013-09-04
申请号:CN201310225735.X
申请日:2013-06-06
Applicant: 哈尔滨工业大学
Abstract: 本发明涉及一种基于笔画片段和轮廓特征的笔迹识别方法,首先需要将书写人书写的笔迹用扫描仪扫描成静态图像,然后利用图像处理技术将笔迹图像进行二值化和边缘提取得到相应的二值图像和轮廓图像,然后利用本发明提出的特征提取方法分别对二值图像和轮廓图像进行特征提取,最后利用模式识别技术对提取的特征进行身份识别。本发明提取了一种新的基于笔画片段和码书技术的特征提取方法和新的基于笔画轮廓的特征提取方法。并将两个提出的特征进行融合,进一步提高了识别精度。
-
公开(公告)号:CN107247952B
公开(公告)日:2020-11-10
申请号:CN201610604722.7
申请日:2016-07-28
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于深层监督的循环卷积神经网络的显著性检测方法,其包括如下步骤:一、初级深层网络结构的设计;二、循环卷积神经网络的设计;三、深层监督的循环卷积神经网络的设计;四、模型的训练与测试。本发明提出了一种新的网络结构,在不增加模型参数的同时增加了网络结构的深度,并采用多层监督信息来对模型进行有效地训练。本发明提出的深层监督的循环卷积神经网络除了在显著性检测领域能取得很好的效果外,还可以用于所有的基于像素分类的图像处理和计算机视觉领域的应用中。
-
公开(公告)号:CN108345850A
公开(公告)日:2018-07-31
申请号:CN201810103800.4
申请日:2018-02-01
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于超像素的笔画特征变换和深度学习的区域分类的场景文本检测方法,所述方法包括如下步骤:一、字符区域提取:(一)基于超像素的笔画特征变换:(1)超像素分割和聚类;(2)删除背景区域;(3)区域细化;(二)基于深度学习的区域分类:(1)特征提取;(2)特征融合;(3)区域分类;二、文本区域检测:(1)候选文本区域生成;(2)候选文本区域分类。本发明的方法不仅可以实现自然场景中不同大小的文本检测,而且可以实现自然场景中不同颜色的文本检测,包括与背景颜色接近的文本,还可以实现复杂背景下的文本检测,如栅栏、窗户等场景中的文本检测。
-
公开(公告)号:CN106778757A
公开(公告)日:2017-05-31
申请号:CN201611137890.6
申请日:2016-12-12
Applicant: 哈尔滨工业大学
CPC classification number: G06K9/2054 , G06K9/342 , G06N3/084
Abstract: 本发明公开了一种基于文本显著性的场景文本检测方法,该方法包括如下步骤:初始文本显著性检测、文本显著性细化和文本显著性区域分类。在初始文本显著性检测阶段,设计了用于文本显著性检测的CNN模型,该模型能从图像中自动学习能够表征文本内在属性的特征并得到对文本有意识的显著性图。在文本显著性细化阶段,设计了文本显著性细化CNN模型用来对粗糙的文本显著性区域进行进一步文本显著性检测。在文本显著性区域分类阶段,使用文本显著性区域分类CNN模型过滤非文本区域,并得到最终的文本检测结果。本发明通过在场景文本检测过程中引入显著性检测,能有效地检测场景中的文本区域,提高场景文本检测方法的性能。
-
公开(公告)号:CN107784308B
公开(公告)日:2020-04-03
申请号:CN201710930183.0
申请日:2017-10-09
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于链式多尺度全卷积网络的显著性目标检测方法,所述方法步骤如下:对于一张图片I,先将其调整成不同尺度的一系列图片:{I1,I2,···,Im}作为多个SSFCN的输入;不同尺度的SSFCNi‑1对应的输入为X={I1,I2,···,Im},输出为Y={M1,M2,···,Mm},传到下一个SSFCN网络的状态S={S1,S2,···,Sm};将SSFCNi‑1的输出大小调整到Ii的大小与Ii一起作为SSFCNi的输入,将SSFCNi‑1的最后一个反卷积层的输出大小调整到Ii的大小和SSFCNi‑1的最后一个反卷积层的输出进行融合;将所有SSFCN的结果调整到与输入图像I相同大小,用一个简单的卷积网络整合得到最终的显著性图像。本发明可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
公开(公告)号:CN107784308A
公开(公告)日:2018-03-09
申请号:CN201710930183.0
申请日:2017-10-09
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于链式多尺度全卷积网络的显著性目标检测方法,所述方法步骤如下:对于一张图片I,先将其调整成不同尺度的一系列图片:{I1,I2,···,Im}作为多个SSFCN的输入;不同尺度的SSFCNi-1对应的输入为X={I1,I2,···,Im},输出为Y={M1,M2,···,Mm},传到下一个SSFCN网络的状态S={S1,S2,···,Sm};将SSFCNi-1的输出大小调整到Ii的大小与Ii一起作为SSFCNi的输入,将SSFCNi-1的最后一个反卷积层的输出大小调整到Ii的大小和SSFCNi-1的最后一个反卷积层的输出进行融合;将所有SSFCN的结果调整到与输入图像I相同大小,用一个简单的卷积网络整合得到最终的显著性图像。本发明可以很好的进行显著性目标检测,并在多个数据库上取得了最好的结果。
-
-
-
-
-
-
-
-
-