一种基于webkit的网络数据爬取方法和系统

    公开(公告)号:CN116628302A

    公开(公告)日:2023-08-22

    申请号:CN202310432584.9

    申请日:2023-04-21

    Abstract: 公开了一种基于webkit的网络数据爬取方法和系统,包括基于webkit修改浏览器设置和UA头部,跳过应用官方对自动化工具或浏览器的检测;调用JS注入模块接口注入C++和JS脚本,替换浏览器内置自定义对象,模拟内置浏览器环境,执行应用官方的JS代码进行数据的加密和解密;利用底层网络模块的自定义方法进行网络消息拦截,获取官方应用返回的数据,截取关键参数信息和cookie信息,为HTTP请求提供参数支持,完成对数据的获取。本申请能够绕过一些web验证,有效的提高了网络数据提取能力。

Patent Agency Ranking