一种实现流式和多模式快速查找网页中URL链接的方法

    公开(公告)号:CN107122389B

    公开(公告)日:2018-05-04

    申请号:CN201710123247.6

    申请日:2017-03-03

    Abstract: 本发明公开了一种实现流式和多模式快速查找网页中URL链接的方法。本发明首先创建链接标签匹配关键词字典,在字典中加入要处理的链接标签匹配关键词记录。其次读取Web服务器返回的一个响应数据包,将响应数据包的第一个字节地址设为数据处理起始点。对读取的当前字节与链接标签关键词字典中的一个标签关键词的左端边界或右端边界进行匹配;直到该响应的所有数据包处理完毕后如果非标签缓冲区不为空,则将非标签缓冲区数据发送给客户端。本发明利用流式思想,对收到的数据包即可进行操作并转发,不需要对所有数据进行缓存才能进行操作,提高了时间效率的同时也减轻了代理服务器的负担,增强了系统的健壮性。

    一种实现流式和多模式快速查找网页中URL链接的方法

    公开(公告)号:CN107122389A

    公开(公告)日:2017-09-01

    申请号:CN201710123247.6

    申请日:2017-03-03

    CPC classification number: G06F17/30887

    Abstract: 本发明公开了一种实现流式和多模式快速查找网页中URL链接的方法。本发明首先创建链接标签匹配关键词字典,在字典中加入要处理的链接标签匹配关键词记录。其次读取Web服务器返回的一个响应数据包,将响应数据包的第一个字节地址设为数据处理起始点。对读取的当前字节与链接标签关键词字典中的一个标签关键词的左端边界或右端边界进行匹配;直到该响应的所有数据包处理完毕后如果非标签缓冲区不为空,则将非标签缓冲区数据发送给客户端。本发明利用流式思想,对收到的数据包即可进行操作并转发,不需要对所有数据进行缓存才能进行操作,提高了时间效率的同时也减轻了代理服务器的负担,增强了系统的健壮性。

Patent Agency Ranking