-
公开(公告)号:CN112364838B
公开(公告)日:2023-04-07
申请号:CN202011429519.3
申请日:2020-12-09
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
IPC: G06V30/226 , G06V10/764 , G06T3/00 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本发明提供了一种利用合成的联机文本图像改进手写OCR性能的方法,包括以下步骤:步骤S1,选取和划分数据集,采用IAM数据集,所述中IAM数据集含有IAM手写数据集和IAM联机手写数据集;步骤S2,构建风格GAN网络的生成器,所述生成器包括三个部分,内容编码器、内容解码器和风格编码器;步骤S3,训练网络中的的生成器;步骤S4,通过训练出来的生成器网络模型对联机数据集中文本图像进行合成。采用本发明框架生成的手写图像能够有效提升OCR识别精度,对于采集和构造大规模手写数据集提供了一个可行的替代方案。
-
公开(公告)号:CN112686251A
公开(公告)日:2021-04-20
申请号:CN202011567259.6
申请日:2020-12-25
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
Abstract: 本发明公开一种维度分解的候选区域提取方法,包括以下步骤:S1、选取并划分数据集;S2、构建候选区域网络RPN;S3、使用预训练检测器模型和候选区域网络RPN一起训练得到模型;S4、用测试集对得到的模型进行测试,评估模型性能,本发明对anchor进行改进,使得其能很好适应不同的检测器,具体表现在对目标的宽高解耦来分解检测维度,从而减轻目标形状变化对检测造成的影响,而且本发明提出的RPN可以直接用于不同的检测模型,任务和数据集,而无需修改任何超参数或进行专门的优化。
-
公开(公告)号:CN112183649A
公开(公告)日:2021-01-05
申请号:CN202011069030.X
申请日:2020-09-30
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
Abstract: 本发明公开了一种用于对金字塔特征图进行预测的算法,包括:选取和划分数据集,并对数据集的输入的图片进行预处理操作;对类FCOS的网络架构的head部分进行修改并设为新网络结构;将输入数据送入backbone网络中获取输入数据的特征图,在特征图的每一点上面进行回归操作,进行网络训练获取网络模型;将预训练的网络模型应用到测试图片中,从特征金字塔的多个Head中获得预测的结果;本发明通过对其中预测网络部分的head网络采用轻量级简易的模型改进,得到不同层次上特征图的预测结果,再对金字塔特征图不同层次上的预测结果进行结合,得到最后预测结果,其准确率比起当前目标检测领域的SOAT方法有显著提升。
-
公开(公告)号:CN111899169A
公开(公告)日:2020-11-06
申请号:CN202010628571.5
申请日:2020-07-02
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
IPC: G06T3/40 , G06T5/00 , G06T5/50 , G06T7/11 , G06T7/13 , G06T7/40 , G06K9/34 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于语义分割的人脸图像的分割网络的方法,包括:获得图像数据集;构建分割的深度卷积网络结构;用网络结构去训练数据得到训练模型;用验证集进行验证、调参,并选出最优模型;用测试集对选出的最优模型进行测试。本发明通过采用轻量级的模型,采取空间通道和上下文信息通道结合,在原来的空间网络结构上,逐步增加高分辨率到低分辨率的子网,形成更多的阶段,并将多分辨率子网并行连接得到本发明的信息交互模块。再进行了多次多尺度融合,使得每一个高分辨率到低分辨率的表征都从其他并行表示中反复接收信息,从而得到丰富的高分辨率表征。由于采用的是并行连接,能够保持高分辨率的表示,因此,预测在空间上更精确。
-
公开(公告)号:CN111899169B
公开(公告)日:2024-01-26
申请号:CN202010628571.5
申请日:2020-07-02
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
IPC: G06F30/20
Abstract: 本发明公开了一种基于语义分割的人脸图像的分割网络的方法,包括:获得图像数据集;构建分割的深度卷积网络结构;用网络结构去训练数据得到训练模型;用验证集进行验证、调参,并选出最优模型;用测试集对选出的最优模型进行测试。本发明通过采用轻量级的模型,采取空间通道和上下文信息通道结合,在原来的空间网络结构上,逐步增加高分辨率到低分辨率的子网,形成更多的阶段,并将多分辨率子网并行连接得到本发明的信息交互模块。再进行了多次多尺度融合,使得每一个高分辨率到低分辨率的表征都从其他并行表示中反复接收信息,从而得到丰富的高分辨率表征。由于采用的是并行连接,能够保持高分辨率的表示,因此,预测在空间上更精确。(56)对比文件Ahmed H. Shahin,et al.,."DeepConvolutional Encoder-Decoders withAggregated Multi-Resolution SkipConnections for Skin LesionSegmentation"《.2019 IEEE 16thInternational Symposium on BiomedicalImaging (ISBI 2019)》.2019,全文.
-
公开(公告)号:CN112287998A
公开(公告)日:2021-01-29
申请号:CN202011166797.4
申请日:2020-10-27
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
Abstract: 本发明公开一种低光照条件下进行目标检测的方法。包括以下步骤:S1、选取和划分数据集;S2、构建低光照条件下目标检测的原始网络结构;S3、预训练各个网络的模型,通过粘合层把各个网络的预训练模型进行结合;S4、通过生成模型对粘合层进行迭代训练,训练出最优粘合层,得到最优网络结构;S5、采用最优网络结构在低光照条件下进行目标检测。本发明能够融合多个不同网络模型,使用无监督学习的方式来学习不同域间的差异,进而学到域自适应特性,提升在不同域之间的适应性,方便域的迁移,能够很好地把不同的网络模型合并融合,因此能够避免去构建一个低光照图片数据集,达到省时省力的目的,有效提升目标检测的性能。
-
公开(公告)号:CN111583130A
公开(公告)日:2020-08-25
申请号:CN202010291139.1
申请日:2020-04-14
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
Abstract: 本发明公开了一种用于LPR的恢复车牌图像的方法,包括:对已知数据集中的图像进行一系列操作后,将图像按比例划分成训练集、验证集和测试集;建立用于车牌识别的图像恢复网络的模型,用训练集对其训练,得到相应的训练模型;用验证集来检验训练模型的准确率,进而来调节模型的超参数,优化模型来获得更好性能;将测试集图像输入到已确定好的优选模型,测试其泛化性能,观察车牌图像的恢复效果如何。本方案对车牌图像恢复网络的结构进行重新设计,增加了辅助网络来优化图像的恢复质量,使LPR的鲁棒性显著增加;另外通过去噪和校正网络相结合的方法,获得了很好的效果,因而车牌识别的准确率也相当高,是一个又快又准的识别网络。
-
公开(公告)号:CN112364838A
公开(公告)日:2021-02-12
申请号:CN202011429519.3
申请日:2020-12-09
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
Abstract: 本发明提供了一种利用合成的联机文本图像改进手写OCR性能的方法,包括以下步骤:步骤S1,选取和划分数据集,采用IAM数据集,所述中IAM数据集含有IAM手写数据集和IAM联机手写数据集;步骤S2,构建风格GAN网络的生成器,所述生成器包括三个部分,内容编码器、内容解码器和风格编码器;步骤S3,训练网络中的的生成器;步骤S4,通过训练出来的生成器网络模型对联机数据集中文本图像进行合成。采用本发明框架生成的手写图像能够有效提升OCR识别精度,对于采集和构造大规模手写数据集提供了一个可行的替代方案。
-
公开(公告)号:CN112287998B
公开(公告)日:2024-06-21
申请号:CN202011166797.4
申请日:2020-10-27
Applicant: 佛山市南海区广工大数控装备协同创新研究院 , 佛山市广工大数控装备技术发展有限公司
IPC: G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 本发明公开一种低光照条件下进行目标检测的方法。包括以下步骤:S1、选取和划分数据集;S2、构建低光照条件下目标检测的原始网络结构;S3、预训练各个网络的模型,通过粘合层把各个网络的预训练模型进行结合;S4、通过生成模型对粘合层进行迭代训练,训练出最优粘合层,得到最优网络结构;S5、采用最优网络结构在低光照条件下进行目标检测。本发明能够融合多个不同网络模型,使用无监督学习的方式来学习不同域间的差异,进而学到域自适应特性,提升在不同域之间的适应性,方便域的迁移,能够很好地把不同的网络模型合并融合,因此能够避免去构建一个低光照图片数据集,达到省时省力的目的,有效提升目标检测的性能。
-
公开(公告)号:CN113033573A
公开(公告)日:2021-06-25
申请号:CN202110282902.9
申请日:2021-03-16
Applicant: 佛山市南海区广工大数控装备协同创新研究院
Abstract: 本发明公开了一种基于数据增强的提高实例分割模型检测性能的方法,包括以下步骤:S1、选取用于进行数据增强的数据集;S2、利用复制粘贴技术对数据集进行数据增强,得到增强数据集;S3、通过利用所述增强数据集去训练实例分割模型,进而提高实例分割模型的检测性能。本发明利用的数据增强方法是复制‑粘贴技术,通过将各种比例的各种目标对象粘贴到新的背景图像中,它可以免费创建具有挑战性和新颖性的训练数据。随机选择对象并将其粘贴到目标图像上随机位置的简单策略,可以在多个设置好的基线之上显著地提高性能。
-
-
-
-
-
-
-
-
-