-
公开(公告)号:CN118797112A
公开(公告)日:2024-10-18
申请号:CN202410293302.6
申请日:2024-03-14
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/903
Abstract: 本申请涉及计算机技术领域,提供一种字符串匹配方法及装置。所述方法包括:根据当前正则表达式生成当前非确定有限自动机NFA;对当前NFA中第一跨度类型的种类数与第二跨度类型的种类数的比值进行优化,生成目标NFA;将待匹配字符串与目标NFA中的激活状态集进行匹配。本申请提供的字符串匹配方法及装置可以尽可能提升有限跳转与特殊跳转的种类数量的比值,利用多种类型的有限跳转减少特殊跳转带来的负面影响,从而提高生成激活状态集的效率,以及生成的激活状态集的准确率,进而提高字符串匹配的效率和准确率。
-
公开(公告)号:CN118796314A
公开(公告)日:2024-10-18
申请号:CN202410164488.5
申请日:2024-02-05
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
Abstract: 本申请涉及自动机领域,提供一种非确定型有穷自动机生成方法、装置、设备及存储介质。所述方法包括:对待处理字符创建对应的状态后,为状态添加识别标识,待处理字符是待处理正则表达式中的特殊字符;在生成待处理正则表达式的非确定型有穷自动机NFA后,新增开始状态和结束状态,对带有识别标识的状态进行修正,开始状态用于标记使用NFA进行匹配时内容的开始位置,结束状态用于标记使用NFA进行匹配时内容的结束位置。通过引入特殊的状态集,以开始状态标记开始位置,以结束状态标记结束位置,通过使得NFA保持一致,从而节省NFA运行时,因为NFA图不一致导致的不必要的额外检查开销,提升NFA运行效率。
-
公开(公告)号:CN118797110A
公开(公告)日:2024-10-18
申请号:CN202410004858.9
申请日:2024-01-02
Applicant: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC: G06F16/903 , G06F16/901
Abstract: 本申请涉及计算机技术领域,提供一种自动机构建方法、装置及电子设备。所述方法包括:获取待处理的正则表达式集合,并基于所述正则表达式集合生成抽象语法树;将所述抽象语法树转换成全局NFA,并确定所述全局NFA的有界重复节点;基于所述全局NFA构建全局DFA,并基于所述有界重复节点构建所述全局DFA的子自动机。通过构建两层结构的混合DFA,将正则表达式中的有界重复部分对应的有界重复节点构建为全局DFA下的子自动机,有效规避了在对NFA进行确定化过程中,DFA状态数的指数爆炸,实现了全局DFA状态数的压缩,提升了DFA运行时的性能,减少了算力资源的消耗。
-
-