一种场景图像分类方法、系统及存储介质

    公开(公告)号:CN113269224A

    公开(公告)日:2021-08-17

    申请号:CN202110311736.0

    申请日:2021-03-24

    Inventor: 许勇 黎枫 全宇晖

    Abstract: 本发明公开了一种场景图像分类方法、系统及存储介质,包括获取训练和测试的场景图像,并对其进行类别划分,获得相应类别标签数据库;将场景图像数据库划分为训练集和测试集,进行预处理后作为网络模型的输入;训练局部分形统计描述网络模型,保存训练完成的网络参数,所述局部分形统计描述网络模型包括基于ResNet预训练模型的特征提取器和局部分形密度图估计分支、全局池化分支、全连接层分类器;将保存好的网络模型加载,进行验证和测试。本发明相对于其他深度学习方法,引入局部密度估计模块,能够更好的处理多种光照变化,在真实场景下分类准确率更高。

    一种基于深度感知网络的图像失焦去模糊方法

    公开(公告)号:CN113012071A

    公开(公告)日:2021-06-22

    申请号:CN202110339430.6

    申请日:2021-03-30

    Inventor: 许勇 祝叶

    Abstract: 本发明提供了一种基于深度感知网络的图像失焦去模糊方法,包括S1,对待去模糊图像进行预处理;S2,将待去模糊图像输入至已训练好的深度感知网络模型中,得到恢复图像;S3,将得到的恢复图像与真实清晰图像进行对比,计算衡量指标PSNR;本发明有效地利用深度图像的辅助失焦模糊的恢复,通过足够数据对网络进行训练使其学习退化映射,从而得到一个有效且快速的失焦去模糊图像复原网络,本发明可应用相机的图像处理中。

    一种基于深度重分形频谱网络的纹理图像分类方法

    公开(公告)号:CN113011506A

    公开(公告)日:2021-06-22

    申请号:CN202110311743.0

    申请日:2021-03-24

    Abstract: 本发明公开了一种基于深度重分形频谱网络的纹理图像分类方法,包括获取纹理图像及其对应的类别标签数据库;对纹理图像进行预处理,作为深度重分形频谱网络模型的输入;构建深度重分形频谱网络模型,并进行训练,所述深度重分形频谱网络模型包括对纹理图像进行特征提取,提取后的特征分别输入两个旁支进行计算得到特征向量,再通过双线性池化层对两个特征向量进行耦合,最后通过全连接层与Softmax函数映射成训练数据集所对应的类别数相等的类别预测概率向量,概率向量数值大的向量元素所对应的索引即为预测类别;利用训练后的深度重分形频谱网络模型,实现纹理图像的分类。本发明在真实场景下分类准确率更高。

    基于U型残差网络的文本擦除和抠字方法

    公开(公告)号:CN112733861A

    公开(公告)日:2021-04-30

    申请号:CN202110117567.7

    申请日:2021-01-28

    Inventor: 许勇 余博西 黄艳

    Abstract: 本发明公开了基于U型残差网络的文本擦除和抠字方法,方法包括以下步骤:构建训练集及标准答案图,制造含文字的自然场景图像,生成标准答案图;训练集预处理;提取特征,将含文字的自然场景图片输入U型残差网络进行训练,提取信息;图像重构,将多个U型残差网络的输出特征进行拼接后,通过残差连接保留图像的低频信息,结合经过自动编码器解析的高频信息,输出图像;深层监督,优化U型残差网络;循环训练网络,直至得到所需标准。本发明基于U型残差网络和自动编码器的架构,解决了文本图像定位和图像域变换的基本问题,可以应对复杂文本的文本擦除和扣字。

    一种基于深度学习的单图像去反射方法

    公开(公告)号:CN112102182A

    公开(公告)日:2020-12-18

    申请号:CN202010893079.0

    申请日:2020-08-31

    Abstract: 本发明公开了一种基于深度学习的单图像去反射方法。本发明利用重影线索,利用双重反射合成建模,首先根据传统方法或者深度学习的方法进行重影卷积核参数估计,利用深度网络估计背景层图像和反射层图像提出自监督,从而达到更好的去反射的目的。本发明使用传统方法或者深度学习的方法对于重影卷积核k估计,更好的利用反射图像中重影线索,从而分离重影反射图像的背景层图像和反射层图像。本发明对于估计重影卷积核k和估计背景层图像T、反射层图像R的模型进行预训练,从而加快模型收敛速度,提高模型表现。本发明能够对大部分的自然场景重影反射图像产生较好的复原效果。

    一种书法作品图像的裁剪和识别方法

    公开(公告)号:CN111160147A

    公开(公告)日:2020-05-15

    申请号:CN201911292817.X

    申请日:2019-12-16

    Abstract: 本发明公开了一种书法作品图像的裁剪和识别方法,包括S1用户通过广角摄像头对书法作品进行拍照;S2对拍摄的书法作品图像进行颜色范围过滤,定位到纸张所在区域,并进行二值化得到二值图像;S3、对二值图像进行垂直投影,得到垂直投影直方图;S4、对二值图像进行水平投影,得到水平投影直方图;S5、根据垂直和水平投影直方图和预设像素点个数阈值逐个裁剪出书法作品中的单字并保存至预设文件夹;S6、调用预先训练好的分类模型进行书法单字识别;S7、根据识别结果判断是否进行后续评价。本发明具有灵活、实时、识别准确率高等优点,并解决了传统方法中对拍摄环境光线、干扰物等要求较高的问题。

    一种基于双流网络的RGBD图像联合恢复方法

    公开(公告)号:CN111104532A

    公开(公告)日:2020-05-05

    申请号:CN201911400820.9

    申请日:2019-12-30

    Inventor: 许勇 祝叶 李芃

    Abstract: 本发明涉及一种基于双流网络的RGBD图像联合恢复方法,包括:S1,获取用于训练和测试的RGBD图像数据库;S2,将RGBD图像数据库划分为训练数据集及测试数据集,并对RGBD图像数据库的RGBD图像进行预处理;S3,根据训练数据集训练双流卷积网络模型,保存训练完成的网络参数;S4,将测试数据集输入双流卷积网络模型进行联合恢复,并测试恢复程度。本发明能够同时对退化的RGB图像及其对应的深度图像进行修复,符合实际应用场景。

    一种基于半监督学习的行人检测方法

    公开(公告)号:CN106897738B

    公开(公告)日:2019-07-16

    申请号:CN201710052773.8

    申请日:2017-01-22

    Inventor: 王树锋 吴斯 许勇

    Abstract: 本发明公开了一种基于半监督学习的行人检测方法,首先获取源图像集的训练样本和所属类别,将目标场景图像集中的一部分图像进行行人标记,获取目标场景图像对应的训练样本和样本特征;其次由源图像集的训练样本训练生成决策森林,目标场景图像集中知晓所属类别的训练样本对决策森林中的决策树进行筛选,重组后产生新的决策森林;再者通过新的决策森林对目标场景图像集中未知所属类别训练样本进行评分,将置信度高的训练样本标记为行人训练样本;然后通过目标场景图像集中知晓输送类别的训练样本以及上述行人训练样本训练神经网络;最后测试样本输入至新的决策森林,将置信度高的测试样本通过神经网络得出行人检测结果。具有行人检测精度高的优点。

    一种基于深度卷积特征的视频行为识别方法

    公开(公告)号:CN108229338A

    公开(公告)日:2018-06-29

    申请号:CN201711340444.X

    申请日:2017-12-14

    Inventor: 许勇 张银珠

    Abstract: 本发明公开了一种基于深度卷积特征的视频行为识别方法,包括以下步骤:1)提取视频的密集轨迹;2)提取视频的深度卷积空间特征;3)计算视频光流并提取深度卷积时态特征;4)对深度卷积空间特征和深度卷积时态特征分别依次进行时空归一化、通道间归一化;5)对归一化后的空间特征和时态特征分别沿密集轨迹进行时序池化操作;6)将池化后的空间特征和时态特征联结后利用LSTM网络进行分类。所述方法在结合深度学习特征和轨迹特征的过程中,考虑了轨迹特征的时序信息,能更加有效地利用视频轨迹信息,使特征提取更加准确,最后使用LSTM网络作为分类器,有利地提高了行为识别的准确率。

    一种基于半监督学习的行人检测方法

    公开(公告)号:CN106897738A

    公开(公告)日:2017-06-27

    申请号:CN201710052773.8

    申请日:2017-01-22

    Inventor: 王树锋 吴斯 许勇

    CPC classification number: G06K9/6257 G06K9/00771 G06K9/6269 G06K9/6282

    Abstract: 本发明公开了一种基于半监督学习的行人检测方法,首先获取源图像集的训练样本和所属类别,将目标场景图像集中的一部分图像进行行人标记,获取目标场景图像对应的训练样本和样本特征;其次由源图像集的训练样本训练生成决策森林,目标场景图像集中知晓所属类别的训练样本对决策森林中的决策树进行筛选,重组后产生新的决策森林;再者通过新的决策森林对目标场景图像集中未知所属类别训练样本进行评分,将置信度高的训练样本标记为行人训练样本;然后通过目标场景图像集中知晓输送类别的训练样本以及上述行人训练样本训练神经网络;最后测试样本输入至新的决策森林,将置信度高的测试样本通过神经网络得出行人检测结果。具有行人检测精度高的优点。

Patent Agency Ranking