-
公开(公告)号:CN114241506A
公开(公告)日:2022-03-25
申请号:CN202111537281.0
申请日:2021-12-15
Applicant: 北京构力科技有限公司
IPC: G06V30/422 , G06K9/62 , G06V30/148 , G06V30/19
Abstract: 本公开的实施例涉及一种标识和提取PDF建筑图纸内容的方法。该方法包括:基于PDF规范对PDF图纸进行解析,以获取包括在多个图层的每个图层中的矢量数据,用以还原图纸内容的位置和尺寸信息;通过使用矢量数据来绘制图层图片;将图层图片输入到GoogLeNet模型,以对图层图片进行分类来确定图层类别;以及至少部分地基于矢量数据与图层类别的结合,通过使用图形处理算法和文字标识算法来计算构件结构化数据。通过使用该方法,可以有利地获取精确的矢量信息,同时避免直接操作DWG文件,相较于现有技术提高了精度和保密性,并且分类不依赖图层名信息来匹配图层类别,而是根据图层的内容来匹配图层的类别,提高了技术的普适性。
-
公开(公告)号:CN114241506B
公开(公告)日:2024-08-02
申请号:CN202111537281.0
申请日:2021-12-15
Applicant: 北京构力科技有限公司
IPC: G06V30/422 , G06V30/148 , G06V30/19
Abstract: 本公开的实施例涉及一种标识和提取PDF建筑图纸内容的方法。该方法包括:基于PDF规范对PDF图纸进行解析,以获取包括在多个图层的每个图层中的矢量数据,用以还原图纸内容的位置和尺寸信息;通过使用矢量数据来绘制图层图片;将图层图片输入到GoogLeNet模型,以对图层图片进行分类来确定图层类别;以及至少部分地基于矢量数据与图层类别的结合,通过使用图形处理算法和文字标识算法来计算构件结构化数据。通过使用该方法,可以有利地获取精确的矢量信息,同时避免直接操作DWG文件,相较于现有技术提高了精度和保密性,并且分类不依赖图层名信息来匹配图层类别,而是根据图层的内容来匹配图层的类别,提高了技术的普适性。
-