-
公开(公告)号:CN117831062A
公开(公告)日:2024-04-05
申请号:CN202410031712.3
申请日:2024-01-09
Applicant: 东南大学 , 国网河北省电力有限公司电力科学研究院 , 国网经济技术研究院有限公司
IPC: G06V30/422 , G06V30/19 , G06V30/18
Abstract: 本发明公开一种基于多特征融合Transformer的电气图纸分类方法及系统,属于电气图纸分类技术领域;一种基于多特征融合Transformer的电气图纸分类方法包括:构建包括本地特征提取网络、全局特征提取网络以及MLP分类网络在内的Transformer模型;将电气图纸数据输入所述Transformer模型进行训练;利用训练后的Transformer模型自动判断图纸类型并分类;并且,本发明的Transformer模型能够捕捉关键特征,提高分类精度,提高模型训练效率,克服手动分类的耗时耗力的问题,促进变电站智能运维的发展。
-
公开(公告)号:CN117746282A
公开(公告)日:2024-03-22
申请号:CN202311638710.2
申请日:2023-12-01
Applicant: 国网经济技术研究院有限公司 , 国网河北省电力有限公司电力科学研究院 , 东南大学
IPC: G06V20/40 , G06V10/774 , G06V10/74 , G06V30/14 , G06T7/11
Abstract: 本发明公开了一种视频关键帧提取方法及端子排实物接线识别方法,视频关键帧提取方法包括:遍历目标视频流数据,将其按每秒拆解成M帧图像,并给每帧图像分配一个ID;将每帧所述图像转换为灰度图像;通过哈希算法获取每帧所述灰度图像的哈希值,将相邻帧所述灰度图像的哈希值进行比较,计算每帧所述灰度图像和前一帧所述灰度图像之间的帧差;将每帧所述灰度图像分割为多个大小相同的小块,计算每帧所述灰度图像和前一帧所述灰度图像之间的相似性指标;根据每个ID对应的所述帧差和所述相似性指标选取最优的图像作为提取结果;通过视频关键帧提取方法提取清晰的图像,从而提高后续端子排实物接线识别的检测精度和推理速度。
-
公开(公告)号:CN116563879A
公开(公告)日:2023-08-08
申请号:CN202310536472.8
申请日:2023-05-12
Applicant: 东南大学
IPC: G06V30/422 , G06V30/146 , G06V30/14 , G06V10/82
Abstract: 本发明提供电气图纸中多行文字和/或多角度文字识别方法及系统,涉及图像辨析领域。该电气图纸中多行文字和多角度文字识别方法,包括:通过YOLOv5目标检测算法,检测多行文字所在区域;将识别结果保留坐标,将多行文字所在区域提取;对提取的多行文字区域,再通过YOLOv5目标检测算法,进行单行文字检测;将属于同一多行文字区域的单行文字进行拼接;对于检测出的单行文字,对文字图片进行三次旋转,分别为90度、180度、270度,并保存;通过OCR识别四个方向的文字,并选出置信度最高的方向的文字识别结果作为输出结果;若置信度低于阈值,则重复检测多行文字所在区域,高于阈值则作为输出结果。该方法解决了对电气图纸中复杂文字的识别。
-
-