-
公开(公告)号:CN109344850A
公开(公告)日:2019-02-15
申请号:CN201810845742.2
申请日:2018-07-27
Applicant: 华南理工大学
Abstract: 本发明提供一种基于YOLO框架的水表自动检测方法,具体包括如下步骤:(1)数据获取:用手机拍摄尽量多水表读数照片,涵盖多种水表(2)数据处理:对照片进行裁剪,处理后大小为480*200(3)label制作:因为采用有监督的方法来检测水表,所以通过人工用软件手动标定水表读数边框(4)训练网络:把准备好的训练数据及label输入到YOLO网络中训练(5)测试网络:输入测试数据到已训练网络中,最后得到水表检测结果和概率。本发明利用YOLO实现了水表的自动检测,能快速地将水表读数区域检测出,检测时间为0.08秒,检测准确率达99.5%,具有极高的实用性和应用价值。
-
公开(公告)号:CN109029641A
公开(公告)日:2018-12-18
申请号:CN201810847125.6
申请日:2018-07-27
Applicant: 华南理工大学
IPC: G01F25/00
Abstract: 本发明提供了一种基于Faster‑rcnn的水表自动检测方法。具体包括如下步骤:(1)数据获取:用手机拍摄50000多张水表读书照片,涵盖多种水表(2)数据处理:对照片进行裁剪,处理后大小为480*200(3)label制作:采用有监督的方法来检测水表,通过人工用软件手动标定水表读数边框(4)训练网络:把准备好的训练数据及label输入到Faster‑rcnn网络中训练(5)测试网络:输入测试数据到已训练网络中,最后得到水表检测结果和概率。本发明利用Faster‑rcnn实现了水表的自动检测,能快速地将水表读数区域检测出,检测时间为0.177秒,检测准确率达99%,具有极高的实用性和应用价值。
-
公开(公告)号:CN108322221A
公开(公告)日:2018-07-24
申请号:CN201710038007.6
申请日:2017-01-18
Abstract: 本发明公开了一种用于深度卷积神经网络模型压缩的方法,包括步骤:对于已经训练完成的深度卷积神经网络模型进行再训练,去除其中冗余的网络连接;对卷积神经网络的各网络层的剩余连接的权值进行编码;对卷积神经网络的各网络层的剩余连接的权值进行k-means聚类;对聚类结果进行微调;保存微调后的结果,并对保存的文件进行哈夫曼编码。本发明通过动态阈值的设定,能够较平缓地去除网络中的连接,使网络能够从连接被去除的不利情况中恢复,从而能够达到相同准确率损失的情况下,压缩倍数较高的效果;在剩余连接编码过程中,使用的改进的CSR编码方法可以减少表示索引值所需要的比特位数,从而能够减小压缩文件的大小,提高压缩率。
-
公开(公告)号:CN105469407B
公开(公告)日:2018-06-22
申请号:CN201510862964.1
申请日:2015-11-30
Applicant: 华南理工大学
Abstract: 本发明提供一种基于改进的引导滤波器的人脸图像图层分解方法,对人脸图像亮度通道进行改进型引导滤波,得到人脸结构信息层,进一步差分运算得到纹理细节层。本发明对引导滤波器进行正则化因子自适应调整优化和对参数矩阵图像进行高斯模糊和腐蚀处理,使得人脸图像在不同区域获得不同滤波效果。应用于数字化妆系统,获得优异的图层分解效果,显著降低图层分解的时间复杂度。
-
公开(公告)号:CN108090443A
公开(公告)日:2018-05-29
申请号:CN201711352220.0
申请日:2017-12-15
Applicant: 华南理工大学
Abstract: 本发明公开了基于深度强化学习的场景文本检测方法及系统,所述方法包括:训练一个特征提取网络;训练一个决策网络;通过特征提取网络和决策网络定位待检测图像上场景文本的位置;其中,所述特征提取网络为场景文本图像特征提取的深度卷积神经网络;所述决策网络为拟合强化学习Q值函数的神经网络。本发明将场景文本检测解析为基于视觉的连续性决策问题,结合强化学习与深度神经网络,模拟日常生活中人眼从整图开始逐渐聚焦到目标物体的过程;在训练过程中,利用深度神经网络,很好地提取出当前定位框图像信息,以强化学习方法训练出能进行目标文本定位的模型。
-
公开(公告)号:CN107220641A
公开(公告)日:2017-09-29
申请号:CN201610169483.7
申请日:2016-03-22
Abstract: 本发明介绍了一种基于深度学习的多语言文本分类方法。具体包括下列步骤:获取多语言文本训练图像集;图像文本行分割、高度归一化、二值化处理;增加训练图像集复杂度,扩大样本空间;设计深度卷积神经网络,利用训练图像集进行训练;切割拟分类的文本图片,输入所设计的深度卷积神经网络,根据神经网络学习到的概率分布,对概率分布求均值,输出分类结果。本发明通过设计深度卷积神经网络,学习区分多语言文本的特征,能够使计算机对不同语言文本进行精确分类。
-
-
公开(公告)号:CN104021295B
公开(公告)日:2017-06-06
申请号:CN201410261547.7
申请日:2014-06-12
Applicant: 广州三星通信技术研究有限公司 , 三星电子株式会社 , 华南理工大学
IPC: G06F19/00
Abstract: 提供了一种用于运动识别的聚类特征融合方法和装置,所述方法包括:将从被采集者的加速度信号中提取的时频域特征集的子集内的时频域特征表示成以聚类中心为基向量的线性方程组;通过求解线性方程组来确定每组聚类中心基向量的系数;使用聚类中心基向量的系数计算聚类中心基向量对子集的方差贡献率;基于方差贡献率计算子集的聚类中心的融合权重;以及基于融合权重来获得融合后的时频域特征集。
-
公开(公告)号:CN106650725A
公开(公告)日:2017-05-10
申请号:CN201611070587.9
申请日:2016-11-29
Applicant: 华南理工大学
CPC classification number: G06K9/325 , G06N3/0454 , G06N3/084
Abstract: 本发明公开了基于全卷积神经网络的候选文本框生成和文本检测方法,包括步骤:生成文本区域候选框,inception‑RPN以自然场景图片和一套标记文本区域的真实边界框作为输入,产生可控数量的单词区域候选框,在VGG16模型的卷积特征响应图上滑动一个inception网络,并在每个滑动位置辅助一套文本特征先验框;并入容易引起歧义的文本类别监督信息,融入多层次的区域下采样信息,进行文本检测;通过反向传播和随机梯度下降,以一种端到端的方式训练inception候选框生成网络和文本检测网络;候选框迭代投票以一种补充的方式获得更高的文本召回率,使用候选框过滤算法,移除过剩的检测框。本发明在ICDAR 2011和2013robust文本检测标准数据库上分别获得0.83和0.85的准确率,优于先前最好的结果。
-
公开(公告)号:CN103220180B
公开(公告)日:2016-12-28
申请号:CN201310153700.X
申请日:2013-04-27
Applicant: 华南理工大学
Abstract: 本发明提出了一种OpenStack云平台异常的处理方法,包括如下步骤:(1)定义异常处理方式;设定异常事件、运行信息位置以及运行信息纠错动作的映射关系;(2)定位信息纠错位置;运行信息纠错是修改数据库和配置文件中的标识,把运行信息纠错定位到数据库信息表中具体的标识位置和配置文件中具体的配置项;(3)指令操作;纠正长时间僵死的状态标识和恢复运行信息(;4)系统自动生成待处理异常列表,并发短信或邮件告知管理人员;(5)评价并反馈处理结果。具有有效提高了OpenStack云计算平台的异常容错能力等优点。
-
-
-
-
-
-
-
-
-