-
公开(公告)号:CN112583857A
公开(公告)日:2021-03-30
申请号:CN202011628116.1
申请日:2020-12-31
Applicant: 湘潭大学
IPC: H04L29/06 , G06F16/955 , G06F16/951
Abstract: 本发明公开了一种网络爬虫识别方法,本方法的步骤包括:S1、设置黑名单,将已知的爬虫请求对应的源IP地址记录在黑名单中;S2、对接收到的请求的源IP地址进行判断,如果在黑名单中,则将该请求识别为网络爬虫,并执行步骤S5;S3、统计请求次数,计算请求频率,如果平均每分钟内请求次数大于60次,则将该请求识别为网络爬虫,将该请求的源IP加入黑名单,并执行步骤S5;S4、对接收到的请求的URL链接进行判断,如果为特殊设置的URL则将该请求识别为网络爬虫,并将该请求的源IP加入黑名单;S5、结束识别。本方法通过预设黑名单和对接收到的请求进行多次识别判断,能够有效的提高爬虫识别的效率和正确率。
-
公开(公告)号:CN112583856A
公开(公告)日:2021-03-30
申请号:CN202011616131.4
申请日:2020-12-31
Applicant: 湘潭大学
Abstract: 本发明公开了一种钓鱼网站拦截方法,包括以下步骤:步骤1、搜集钓鱼网站,建立钓鱼网站数据库;步骤2、分析钓鱼网站数据库,设置敏感词;步骤3、提取待识别网页的信息;步骤4、将待识别网站与钓鱼网站数据库进行对比;步骤5、判断待识别网站页面的是否采用Https协议;步骤6、将网页信息与敏感词进行对比;步骤7、根据判定结果采取相应措施。该方法通过建立数据库并多次识别网站,针对性强,而且能够主动更新数据库,能够高效的识别并拦截钓鱼网站。
-