基于相似度的文档字符串编码匹配方法及装置

    公开(公告)号:CN114168809B

    公开(公告)日:2024-08-09

    申请号:CN202111402289.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种基于相似度的文档字符串编码匹配方法及装置。本公开中针对待匹配字符串,根据预设的编码规则生成待匹配字符串对应的正则表达式;针对目标文档,根据编码规则将目标文档的文本内容生成候选字符串集;将候选字符串集中的字符串与正则表达式进行匹配,保留与正则表达式匹配的字符串,滤除与正则表达式不匹配的字符串;采用SimHash算法分别生成保留的字符串以及候选字符串集中每个字符串的SimHash签名,确定保留的字符串的SimHash签名与候选字符串集中每个字符串的SimHash之间的汉明距离,输出汉明距离低于阈值的字符串及该字符串在目标文档中的位置。有效的提高了文档的解析效率,提高了编码模式匹配的速度。

    基于正则表达式的文档字符串编码识别方法及装置

    公开(公告)号:CN114168808B

    公开(公告)日:2024-08-09

    申请号:CN202111387759.6

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种基于正则表达式的文档字符串编码识别方法及装置。本公开根据正则表达式确定最佳因子集合;采用CW算法确定出现所述最佳因子集合中的最佳因子的文档记录,并将确定的文档记录添加到候选集合中;根据所述正则表达式确定的DFA自动机对候选集合中的最佳因子的字符串进行验证,将得到成功匹配的字符串。在查询正则表达式的时候定义了一个最佳因子,简化了使用正则表达式来查询的方式。根据最佳因子的个数选择CW算法对提取出来的最佳因子集合快速地查询,有效地过滤掉不包含最佳因子的字符串集合,得到候选字符串,并进一步使用DFA自动机对候选集中的字符串编码进行验证,从而提高整体的查询性能。

    核电站生产数据建模方法及装置
    24.
    发明公开

    公开(公告)号:CN115495434A

    公开(公告)日:2022-12-20

    申请号:CN202210719815.X

    申请日:2022-06-23

    Abstract: 本公开属于核电技术领域,具体涉及一种核电站生产数据建模方法及装置。本公开。本公开提供的技术方案中,平台内置了核电厂自身的数据模型规范、数据标准管理相关规范参数及相关的参考数据,用户在使用可视化建模工具时,用户无需再查找核电厂的数据模型规范,只需按自身诉求,通过图形化工具完成自身的数据建模工作,填写必要的建模相关的参数,减少了人员的学习成本。此外,本公开通过精确的可视化表达方式,可清晰直观的表达出核电厂生产业务实体、实体属性、实体间的关系,并可通过可视化界面,展示出数据的来龙去脉,有利于业务相关干系人对业务数据的直观理解和认知,便于理解和沟通相关的数据诉求。

    一种核电厂功能设备组数据自动更新的方法

    公开(公告)号:CN114661731A

    公开(公告)日:2022-06-24

    申请号:CN202011529688.4

    申请日:2020-12-22

    Abstract: 本发明涉及核电厂数据处理技术领域,具体公开了一种核电厂功能设备组数据自动更新的方法。该方法包括:建立核电厂功能设备组数据分类模型,对功能组设备进行分类管理,并根据功能设备组数据的更新内容,将功能设备组更新数据更新到设备和工单中;根据设备中功能设备组新增申请、功能设备组修改申请以及功能设备组删除申请,将设备的功能设备组数据进行自动更新;根据工单任务中功能设备组新增申请、功能设备组修改申请以及功能设备组作废申请,将工单任务的功能设备组数据进行自动更新;该方法可以有效减少因FEG数据更新不及时导致的设备重复停役检修,同时提高了计划工程师、运工等人员的工作效率,保障机组安全稳定运行。

    一种核电厂厂房火灾风险评估方法

    公开(公告)号:CN114548623A

    公开(公告)日:2022-05-27

    申请号:CN202011330468.9

    申请日:2020-11-24

    Abstract: 本发明属于核电厂运行维护技术领域,针对目前核电厂火灾风险评估受到人因影响的技术问题,提供了一种核电厂厂房火灾风险评估方法。技术方案:通过读取电厂防火分区基本信息、消防类许可证中相关信息以及工单中消防系统/设备缺陷等信息,通过对影响火灾风险的各因素进行整合,经过一定权重分析,通过计算得出对应不同风险等级的量化分数,并且将量化的分数通过不同颜色对厂房风险进行标识。有益效果:提供较为准确的火灾风险信息和可量化的评估结果,减少人员经验评估差异性,提高火灾风险评估标准。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541B

    公开(公告)日:2025-03-14

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

Patent Agency Ranking