一种数据提取方法、装置、系统及计算机可读存储介质

    公开(公告)号:CN113656659A

    公开(公告)日:2021-11-16

    申请号:CN202111008308.7

    申请日:2021-08-31

    Abstract: 本发明实施例公开了一种数据提取方法,包括:获取目标待提取数据集合以及最新正则表达式集合;当判定当前正则表达式集合与所述最新正则表达式集合存在相同正则表达式时,将所述当前正则表达式集合中的相同正则表达式的权重值赋给所述最新正则表达式集合中的相同正则表达式;将所述最新正则表达式集合中的正则表达式按权重值从大到小排序;将所述目标待提取数据集合中的待提取数据与排序后的正则表达式进行匹配,得到数据提取结果,同时将匹配到数据的正则表达式的权重值加一。通过动态变更正则表达式的权重值,使匹配成功率更高的正则表达式优先对待提取数据进行提取,提高了数据提取效率。

Patent Agency Ranking