一种文档自动聚类方法
    33.
    发明公开

    公开(公告)号:CN115964481A

    公开(公告)日:2023-04-14

    申请号:CN202111192698.8

    申请日:2021-10-13

    Abstract: 本发明涉及文本数据挖掘技术领域,具体公开了一种文档自动聚类方法。本方法包括:读取待处理的文档,并对文档中的文本内容进行清洗和分词处理,并利用停用词表,对分词进行匹配输出,并对输出结果进行向量化处理,获得高维稀疏文本向量;将文本向量输入自编码器进行编码和译码处理,并通过全局调整函数,提取低维抽象特征向量;根据聚类文档目标,对特征向量进行聚类处理,并直到获得的所有向量簇不再发生变化为止,从中选取最符合目标的向量簇;利用所述向量簇,对文档中的文本数据进行定位输出。本发明具备更高的准确性和更低的运算复杂度,具有更强的实用性和鲁棒性;本方法的计算复杂度较低,具有实用价值以及易用性。

    一种大尺寸复杂pdf工程图纸文本检测与识别方法

    公开(公告)号:CN115035541A

    公开(公告)日:2022-09-09

    申请号:CN202210735421.3

    申请日:2022-06-27

    Abstract: 本发明提供了一种大尺寸复杂pdf工程图纸文本检测与识别方法,包括以下步骤:步骤S1:预处理pdf工程图纸,生成对应的高分辨率图像;步骤S2:将高分辨率图像切割为若干低分辨率的子图,并根据位置记录子图对应顺序;步骤S3:进行第一次子图文本检测,初步定位子图中的文本区域范围,输出范围对应的位置坐标;步骤S4:将子图中的文本区域位置坐标映射到原大图中,去除其中的重复数据,并根据去重后的位置坐标获取对应文本区域图像;步骤S5:进行第二次文本检测,精确定位文本区域中的文本,并裁剪对应的文本块;步骤S6:对文本块进行文本识别,提取文本块中的文本内容,以及对应的坐标位置。本发明提供的方法提高了复杂图纸的文本识别准确率。

    一种核电机组稳压器快速降温的方法

    公开(公告)号:CN112242205B

    公开(公告)日:2022-08-19

    申请号:CN201910640765.4

    申请日:2019-07-16

    Abstract: 本发明所属核电厂技术领域,具体涉及一种核电机组稳压器快速降温的方法。稳压器检修根据设计手册要求壁温小于168度才能进行喷淋冷却,而自然冷却的方法需要至少四天才能达到这个温度,大大延长了等待检修工期。本发明包括如下步骤:步骤一:选择压力设定值;步骤二:选择压力真实值;步骤三:计算蒸汽释放阀PCV5和PCV6开度;步骤四:通过稳定蒸汽流量对稳压器金属避免进行降温;步骤五:计算稳压器温度;步骤六:通过稳定蒸汽流量对稳压器金属壁面进行降温;步骤七:稳压器喷淋降温至检修温度。本发明比正常降温节省了3.375个满功率天,比充水、疏水降温节省了1.5满功率天,能够快速恢复稳压器可用,减少电站经济损失,对机组带来可期的经济效率。

    核电厂隔离冲突调解方法及装置

    公开(公告)号:CN114386925A

    公开(公告)日:2022-04-22

    申请号:CN202111441609.9

    申请日:2021-11-30

    Abstract: 本公开属于核电技术领域,具体涉及一种核电厂隔离冲突调解方法及装置。本公开的核电厂隔离冲突调解方法根据根据输入的安措隔离的数据,快速得到采取隔离措施的挂牌状态与待执行的安措隔离的挂牌状态冲突的隔离边界设备,并自动进行冲突指令调解,将隔离边界设备的挂牌状态修改为安措隔离要求的挂牌状态,实现了自动识别冲突,从而避免了人工手动查询行政隔离或运行隔离清单,减轻隔离经理工作负担,保证核电厂作业现场人员安全、设备安全和工作安全。

    字符串匹配方法及装置
    40.
    发明公开

    公开(公告)号:CN114168807A

    公开(公告)日:2022-03-11

    申请号:CN202111387749.2

    申请日:2021-11-22

    Abstract: 本公开属于核电技术领域,具体涉及一种字符串匹配方法及装置。本公开中,在每读取一页文档的情况下,判断该页文档全部字符在位图对应位的范围内目标数值的个数是否符合所述特定字符串字符的个数,在判断该页文档全部字符在位图对应位的范围内目标数值的个数符合所述特定字符串字符的个数时,根据位图对应位值为目标数值的字符在该页文档中出现的位置,判断该页文档中是否存在特定字符串,本公开运用位图算法的思想,使计算机能够进行快速匹配的同时消耗较小的内存。此外,本公开设计将位图与对应的键值对键值对集合结合起来,达到实现特定字符串匹配的目的。

Patent Agency Ranking