-
公开(公告)号:CN112508098B
公开(公告)日:2022-09-20
申请号:CN202011425408.5
申请日:2020-12-08
Applicant: 南京理工大学 , 浙江华云信息科技有限公司
IPC: G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04
Abstract: 本发明公开了一种表盘定位与自动读数的指针式表计数值识别方法及系统,以多关键点的几何模型描述指针式表计中的刻度、指针端点等信息;利用关键点检测子网络将模型拟合到图像上,并利用关键点间的内在几何约束关系获得表计位置,达到表计定位;同时通过将关键点检测子网络输出的热图输入到示数读取子网络,回归出表计读数。本发明以关键点形式描述表盘指针端点、刻度线等关键信息之间的几何关系,简化了表盘的模型描述,增加了各部件之间的约束;通过表计的关键点检测,将表盘定位、示数读取融合在一个网络中,提高了识别的快速性、稳定性。该方法具有一定的通用性,对不同样式的指针式表计仅依赖于其几何模型描述,与网络模型、训练方法无关。
-
公开(公告)号:CN117746100A
公开(公告)日:2024-03-22
申请号:CN202311558555.3
申请日:2023-11-21
Applicant: 浙江华云信息科技有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/44 , G06V10/82 , G06V10/74 , G06N3/045 , G06N3/0464 , G06N3/0455 , G06N3/0895 , G06N3/084
Abstract: 本发明公开了一种基于提示与对比学习的少样本电力系统缺陷检测方法,首先建立缺陷数据集,构建深度神经网络模型,基于提示学习与对比学习法训练所述深度神经网络模型,然后利用所述训练完成的深度神经网络模型对电力系统进行缺陷检测,针对电力系统缺陷样本少、样本难以获得的情况下,深度检测网络难以训练的问题,通过图文大模型的提示与对比学习方法,降低了缺陷检测模型的训练难度,使模型更有效地从有限的样本中学习,提升了缺陷检测器的检测精度,为电力系统中的少样本缺陷检测提供了一种高效的解决方案。
-
公开(公告)号:CN113283423A
公开(公告)日:2021-08-20
申请号:CN202110126410.0
申请日:2021-01-29
Applicant: 南京理工大学 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种基于生成网络的自然场景扭曲文本图像矫正方法及系统,方法包括:1)扭曲数据增广。在平展文本图像上设置基准点,增广模块通过基准点的运动变换扭曲图像,代理网络与识别网络共同优化使扭曲文本识别难度较大,数据增广以后可获得成对的“平展‑扭曲”文本图像。2)搭建矫正网络。包括平展生成器、判别器,扭曲生成器、判别器,同时在损失函数中引入梯度先验损失,生成清晰度更高的矫正后图像。3)训练矫正网络。使用双向循环方式训练矫正网络。4)应用推理。利用训练后的矫正网络将待处理的自然场景扭曲文本矫正为平展文本。本发明能够有效消除自然场景文本的空间扭曲变形,得到的平展文本清晰度较高,提升了后续识别的精度。
-
公开(公告)号:CN112508098A
公开(公告)日:2021-03-16
申请号:CN202011425408.5
申请日:2020-12-08
Applicant: 南京理工大学 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种表盘定位与自动读数的指针式表计数值识别方法及系统,以多关键点的几何模型描述指针式表计中的刻度、指针端点等信息;利用关键点检测子网络将模型拟合到图像上,并利用关键点间的内在几何约束关系获得表计位置,达到表计定位;同时通过将关键点检测子网络输出的热图输入到示数读取子网络,回归出表计读数。本发明以关键点形式描述表盘指针端点、刻度线等关键信息之间的几何关系,简化了表盘的模型描述,增加了各部件之间的约束;通过表计的关键点检测,将表盘定位、示数读取融合在一个网络中,提高了识别的快速性、稳定性。该方法具有一定的通用性,对不同样式的指针式表计仅依赖于其几何模型描述,与网络模型、训练方法无关。
-
公开(公告)号:CN113283423B
公开(公告)日:2022-08-16
申请号:CN202110126410.0
申请日:2021-01-29
Applicant: 南京理工大学 , 浙江华云信息科技有限公司
Abstract: 本发明公开了一种基于生成网络的自然场景扭曲文本图像矫正方法及系统,方法包括:1)扭曲数据增广。在平展文本图像上设置基准点,增广模块通过基准点的运动变换扭曲图像,代理网络与识别网络共同优化使扭曲文本识别难度较大,数据增广以后可获得成对的“平展‑扭曲”文本图像。2)搭建矫正网络。包括平展生成器、判别器,扭曲生成器、判别器,同时在损失函数中引入梯度先验损失,生成清晰度更高的矫正后图像。3)训练矫正网络。使用双向循环方式训练矫正网络。4)应用推理。利用训练后的矫正网络将待处理的自然场景扭曲文本矫正为平展文本。本发明能够有效消除自然场景文本的空间扭曲变形,得到的平展文本清晰度较高,提升了后续识别的精度。
-
-
-
-