文本存储管理与检索方法及装置

    公开(公告)号:CN114168798B

    公开(公告)日:2024-08-09

    申请号:CN202111387757.7

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种文本存储管理与检索方法及装置。本公开运用了分布式文档系统存储核电厂多堆型多类别海量非结构化文档以及对应的分析结果文档,并将文档存储地址作为文档映射存储在关系型数据库中,解决了海量非结构化文档存储问题,利用结果文档的分析结果,设计了基于跳表的分级索引、存储数据快照的四元组信息,使用TF‑IWF方法针对性的对核电厂多堆型多类别的非结构化文档设计了检索结果排序方式的重要指标,相比使用现有的检索引擎架构,本发明更具有轻型、快速以及针对性的优点,因而具有更强的实用性。

    一种核电站设备分级方法
    44.
    发明公开

    公开(公告)号:CN116166981A

    公开(公告)日:2023-05-26

    申请号:CN202111389672.2

    申请日:2021-11-22

    Abstract: 本发明涉及核电站设备管理技术领域,具体公开了一种核电站设备分级方法。方法具体包括:S1、构建核电站设备分级体系,将核电站设备分级类别与具体功能问题进行匹配;根据核电站设备功能进行分类,将核电站设备出现识别的问题进行归类,并进行参数化匹配,形成核电站设备分级体系结构;S2、将核电站中识别的设备功能进行提取,并根据设备功能状态进行变量转化;对核电站设备分级体系中各个分级类别具体的功能内容进行提取,并以变量参数进行匹配;S3、根据设备功能状态的变量组合,对核电站设备进行分级;本发明所述的一种核电站设备分级方法,能够对核电站设备进行高效快速分级,且分级质量高、分级过程客观,能够有效保证对核电设备分级。

    一种字符串编码模糊检索方法
    45.
    发明公开

    公开(公告)号:CN115982308A

    公开(公告)日:2023-04-18

    申请号:CN202111191809.3

    申请日:2021-10-13

    Abstract: 本发明涉及文本检索技术领域,具体公开了一种字符串编码模糊检索方法。该方法包括:采集获取文档字符串编码,获得相应的分句和分词,建立基于词项分布的倒排索引;构建融合匹配网络,并对所述匹配网络进行训练;将所述文档字符串编码所获得的分句和分词作为融合匹配网络的输入,与已知关键编码进行匹配,并获得匹配结果;将匹配结果,利用所述的倒排索引,来确定包含匹配词项的位置信息,并与所述的匹配结果和置信度一起,共同创建编码结果集,并对原文档中的匹配内容进行标注。本方法具有更好的匹配准确率和鲁棒性,同时,避免了其他检索方法中繁琐的多个处理流程,通过端到端的方式降低了检索时间。

    一种文档自动聚类方法
    46.
    发明公开

    公开(公告)号:CN115964481A

    公开(公告)日:2023-04-14

    申请号:CN202111192698.8

    申请日:2021-10-13

    Abstract: 本发明涉及文本数据挖掘技术领域,具体公开了一种文档自动聚类方法。本方法包括:读取待处理的文档,并对文档中的文本内容进行清洗和分词处理,并利用停用词表,对分词进行匹配输出,并对输出结果进行向量化处理,获得高维稀疏文本向量;将文本向量输入自编码器进行编码和译码处理,并通过全局调整函数,提取低维抽象特征向量;根据聚类文档目标,对特征向量进行聚类处理,并直到获得的所有向量簇不再发生变化为止,从中选取最符合目标的向量簇;利用所述向量簇,对文档中的文本数据进行定位输出。本发明具备更高的准确性和更低的运算复杂度,具有更强的实用性和鲁棒性;本方法的计算复杂度较低,具有实用价值以及易用性。

    一种核电厂运营方参与调试隔离控制的信息化方法

    公开(公告)号:CN115204640A

    公开(公告)日:2022-10-18

    申请号:CN202210750177.8

    申请日:2022-06-28

    Abstract: 本发明属于核电厂运行管理技术领域,具体涉及一种小业主模式下的核电厂运营方参与调试隔离控制的信息化方法。包括如下:调试方和运营方范围分配;运营系统和调试系统的接口;调试方和运营方在工作控制流程的责任划分概述;详细的流程设计描述和数据贯通字段;对于退票情况的处理;实施隔离后的信息传递;工单开工后的信息传递;对于临时签出和临时签入的处理;工单完工;解除隔离;完工报告。其有益效果在于:可以实现小业务模式下运营方在TOB阶段介入调试隔离控制,可以实现运营方系统和调试方系统的具体信息接口和数据贯通,通过本发明调试隔离控制的具体控制流程和数据交互的字段和控制逻辑,可以达到保证调试边界安全管控和移交质量。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

Patent Agency Ranking