-
公开(公告)号:CN105205448B
公开(公告)日:2019-03-15
申请号:CN201510522576.9
申请日:2015-08-24
Applicant: 中国科学院自动化研究所 , 富士通株式会社
Abstract: 一种基于深度学习的文字识别方法,包括:设计更深的多层卷积神经网络结构,把每一个字符作为一个类别;采用反向传播算法训练卷积神经网络用以识别单一字符,有监督地最小化该网络的目标函数,得到字符识别模型;最后根据现有识别出的字符,采用维特比算法从词典中找出最有可能的词语。在测试的时候,给定一个输入,需要先进行滑动窗口扫描获得备选字符,再从备选字符中找出最可能的词语。本方法利用更深的卷积神经网络来学习文字特征,对于文字的颜色、大小、光照、模糊具有鲁棒性,字符识别和词语识别能够保持较高的准确率。
-
公开(公告)号:CN109191366A
公开(公告)日:2019-01-11
申请号:CN201810764054.3
申请日:2018-07-12
Applicant: 中国科学院自动化研究所
IPC: G06T3/00
Abstract: 本发明属于图像合成技术领域,具体提供一种基于人体姿态的多视角人体图像合成方法及装置。旨在解决现有技术无法有效地进行人的多视角图像合成以及保持人的特征不发生明显变化的问题。本发明提供了一种基于人体姿态的多视角人体图像合成方法,包括基于姿态转换模型并根据原始人体姿态和目标视角,对原始人体姿态进行姿态转换;基于前景转换模型并根据原始前景图像、原始人体姿态和目标视角人体姿态,对原始前景图像进行前景转换;基于多视角合成模型并根据原始图像和目标前景图像,对原始图像进行多视角合成,得到多视角人体合成图像。本发明提供的方法具有保持合成图像中人的特征,以及合成高质量的合成图像的有益效果。
-
公开(公告)号:CN108737740A
公开(公告)日:2018-11-02
申请号:CN201810750879.X
申请日:2018-07-10
Applicant: 银河水滴科技(北京)有限公司 , 中国科学院自动化研究所
IPC: H04N5/235
Abstract: 本发明涉及一种图像补光方法及系统,获取在预设场景内采集到图像的图像信息;根据所述图像信息计算光照强度;判断所述光照强度是否处于光照阈值范围内;若所述光照强度未处于光照阈值范围内,则对所述预设场景进行补光。本发明提供的技术方案根据光照变化程度,自动调节补光灯功耗,因此补光强度可以调节可以以相对较低的功耗得到较好的补光效果,同时避免骤开/关的问题,延长补光灯寿命。
-
公开(公告)号:CN108681689A
公开(公告)日:2018-10-19
申请号:CN201810282478.6
申请日:2018-04-02
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00348 , G06N3/0481 , G06N3/084
Abstract: 本发明属于计算机视觉领域,具体涉及一种基于生成对抗网络的帧率增强步态识别方法及装置,旨在降低识别图像的噪声,提高步态识别的准确率。该方法具体包括:首先通过一个生成对抗网络生成数据集中连续两帧之间的帧,然后将生成帧与原始帧合并计算步态能量图,然后通过步态能量图识别网络对个体进行识别。该方法中的生成对抗网络能够显著提高原始图像序列的帧率,同时生成的图像对噪声具有较好的鲁棒性,能够起到对步态能量图进行降噪的作用,同时在步态能量图识别网络中加入了新型边界比率损失函数,能够极好地平衡不同损失函数之间的量级,大大提升模型训练的稳定性。本方法能够明显提升跨视角及不跨视角的步态识别率。
-
公开(公告)号:CN104834748B
公开(公告)日:2018-08-03
申请号:CN201510272498.1
申请日:2015-05-25
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了种利用基于深度语义排序哈希编码的图像检索方法,该方法包括以下步骤:将多标签图像数据集中的部分图像作为训练集,剩下的图像作为图像测试集;使用深度卷积神经网络来构建深度哈希函数;根据图像的多标签信息,构建出图像间的语义相似度排序;以基于三元组的代理排序损失函数做为实际的模型目标函数,并使用随机梯度下降法来优化深度哈希函数;用学习到的深度哈希函数计算图像的哈希码,通过计算测试图像的哈希码与训练集中每个图像的哈希码之间的汉明距离来检索图像。本发明方法能够保留多标签图像在语义空间中的多级相似度,并且联合学习图像的深度特征表达和哈希编码,从而避免了语义信息的损失。
-
公开(公告)号:CN108304797A
公开(公告)日:2018-07-20
申请号:CN201810085316.3
申请日:2018-01-29
Applicant: 中国科学院自动化研究所
Abstract: 本发明涉及计算机视觉技术领域,具体提供了一种基于侧向抑制的视觉注意检测方法及装置,旨在解决如何提高计算机视觉注意机制的有效性和实用性。为此目的,本发明中的视觉注意检测方法包括下述步骤:获取目标图像的图像类别;获取每个激活函数神经元接收到的反馈信息;根据反馈信息判断是否关闭对应的激活函神经元;根据判断结果关闭相应的激活函数神经元后,对激活函数神经元的响应值进行归一化处理,得到选择性注意结果图;对选择性注意结果图进行归一化处理,得到显著性目标检测结果图。本发明的技术方案基于卷积神经网络,并能够利用卷积神经网络的前馈与反馈信息实现对目标物体的信息检测。同时,本发明中的装置能够执行并实现上述步骤。
-
公开(公告)号:CN105072373B
公开(公告)日:2018-03-27
申请号:CN201510540560.0
申请日:2015-08-28
Applicant: 中国科学院自动化研究所
IPC: H04N7/01
Abstract: 本发明公开了一种基于双向循环卷积网络的视频超分辨率方法,包括:建立双向循环网络,包括按照时间顺序的前向循环子网络和后向循环子网络,每个循环子网络自底向上包含一个输入序列层,两个隐含序列层和一个输出序列层,每一序列层包括多个状态,对应于不同时刻的视频帧;用三种卷积操作来连接这些状态,包括前馈卷积,循环卷积和条件卷积,以得到双向循环卷积网络;把训练视频送到建立好的双向循环卷积网络中,利用随机梯度下降算法来最小化预测的和真实的高分辨率视频之间的均方误差,从而迭代地优化该网络的权重,并得到最终的双向循环卷积网络;向所述最终的双向循环卷积网络模型输入待处理的低分辨率视频序列,得到对应的超分辨率结果。
-
公开(公告)号:CN106934817A
公开(公告)日:2017-07-07
申请号:CN201710101482.3
申请日:2017-02-23
Applicant: 中国科学院自动化研究所
CPC classification number: G06K9/00718 , G06K9/00348 , G06K2209/21 , G06T2207/10016
Abstract: 本发明提出一种基于多属性的多目标跟踪方法及装置。所述方法,包括:通过目标跟踪方法确定当前跟踪目标是否处于复杂交叉状态,所述复杂交叉状态是指所述当前跟踪目标在预定数量的连续图像帧中与其他目标发生重叠;在所述当前跟踪目标处于复杂交叉状态时,依次使用当前跟踪目标的身高、衣着属性、步态属性三种信息进行再识别。本发明执行速度极快,同时也保证了准确率,特别是在有交叉发生时比一般方法出错少。
-
公开(公告)号:CN106778705A
公开(公告)日:2017-05-31
申请号:CN201710065013.0
申请日:2017-02-04
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种行人个体分割方法和装置,所述方法包括:利用预先训练好的粗粒度人形轮廓分割模型对待处理图像进行行人分割,得到区块化分割结果;所述区块化分割结果中包括多个标示成背景和前景的区块,在所述对待处理图像中被标示成背景的区块不包含行人主体,而被标示成前景的区块包含行人主体的部分图像;去除所述待处理图像中所述区块化行人分割结果对应部分中的背景图像,得到粗粒度分割图像;将所述粗粒度分割图像输入至预先训练好的细粒度人形轮廓分割模型;所述预先训练好的细粒度人形轮廓分割模型输出个体行人分割结果;其中,所述粗粒度人形轮廓分割模型和细粒度人形轮廓分割模型均通过全卷积神经网络训练得到。
-
公开(公告)号:CN106777891A
公开(公告)日:2017-05-31
申请号:CN201611043691.9
申请日:2016-11-21
Applicant: 中国科学院自动化研究所
IPC: G06F19/00
CPC classification number: G06F19/32
Abstract: 本发明公开了数据特征选择和预测方法及装置。方法包括:步骤S1、采集用户信息和对应的血压观测数据,形成数据集,并从所述数据集中剔除异常值点;步骤S2、从所述数据集中的用户信息中提取用户特征;步骤S3、从所述数据集中的血压观测数据提取血压特征;步骤S4、将所提取的用户特征和血压特征进行归一化处理,处理结果作为训练样本形成训练集,利用所述训练集中的训练样本输入至支持向量机模型和/或梯度迭代决策树模型之中,训练得到预测模型。本发明利用医学知识指导数据的清洗和特征工程选取工作,有效提升模型的准确性。
-
-
-
-
-
-
-
-
-