-
公开(公告)号:CN105184312B
公开(公告)日:2018-09-25
申请号:CN201510522970.2
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。
-
公开(公告)号:CN105205448A
公开(公告)日:2015-12-30
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/00536 , G06K9/6267 , G06K2209/01
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN106934817B
公开(公告)日:2020-11-10
申请号:CN201710101482.3
申请日:2017-02-23
Applicant: 中国科学院自动化研究所
Abstract: 本发明提出一种基于多属性的多目标跟踪方法及装置。所述方法,包括:通过目标跟踪方法确定当前跟踪目标是否处于复杂交叉状态,所述复杂交叉状态是指所述当前跟踪目标在预定数量的连续图像帧中与其他目标发生重叠;在所述当前跟踪目标处于复杂交叉状态时,依次使用当前跟踪目标的身高、衣着属性、步态属性三种信息进行再识别。本发明执行速度极快,同时也保证了准确率,特别是在有交叉发生时比一般方法出错少。
-
公开(公告)号:CN105205448B
公开(公告)日:2019-03-15
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN106934817A
公开(公告)日:2017-07-07
申请号:CN201710101482.3
申请日:2017-02-23
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00718 , G06K9/00348 , G06K2209/21 , G06T2207/10016
Abstract: 本发明提出一种基于多属性的多目标跟踪方法及装置。所述方法,包括:通过目标跟踪方法确定当前跟踪目标是否处于复杂交叉状态,所述复杂交叉状态是指所述当前跟踪目标在预定数量的连续图像帧中与其他目标发生重叠;在所述当前跟踪目标处于复杂交叉状态时,依次使用当前跟踪目标的身高、衣着属性、步态属性三种信息进行再识别。本发明执行速度极快,同时也保证了准确率,特别是在有交叉发生时比一般方法出错少。
-
公开(公告)号:CN105184312A
公开(公告)日:2015-12-23
申请号:CN201510522970.2
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
CPC classification number: G06K9/6256 , G06K9/627 , G06N3/088
Abstract: 本发明公开了一种基于深度学习的文字检测方法及装置。所述方法包括:设计多层卷积神经网络结构,把每一个字符作为一个类别,这样就形成了一个多类别分类问题;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后用前端的特征提取层进行权值初始化,把最后一个全连接层结点数目改为2,使得网络成为一个二分类模型,用文字和非文字样本训练网络。经过以上步骤,一个文字检测分类器就完成了。在测试的时候,把全连接层转化为卷积层,给定一张输入图像,需要先进行多尺度滑动窗口扫描获得文字的概率图,再进行非极大值抑制得到最终的文字区域。
-
-
-
-
-