一种基于浏览器的网页数据抽取方法和系统

    公开(公告)号:CN116821456A

    公开(公告)日:2023-09-29

    申请号:CN202310675183.6

    申请日:2023-06-08

    Abstract: 公开了一种基于浏览器的网页数据抽取方法和系统,包括根据预置关键词,访问社交网站根据预置关键词进行自动搜索;根据搜索结果过滤需访问的主页页面,并获取主页页面的网页源码;根据网页源码判断网页页面类型,并构建各页面类型对应的主页链接,将主页链接作为任务下发至第一消息队列中;调用预先配置好的社交网站登录账号,通过代理服务自动登录社交网站,通过爬虫程序从第一消息队列中下载网页源码,解析并抽取网页数据。本申请实现了对社交媒体网站访问到内容抽取的系统设计流程,解决了传统爬虫针对社交媒体网站采集难、代理易被封、帐号易被封等问题,为社交媒体网站中信息的发现与应用构建提供了数据支撑。

    一种远程电子数据取证方法及系统

    公开(公告)号:CN114443562A

    公开(公告)日:2022-05-06

    申请号:CN202111591723.X

    申请日:2021-12-23

    Abstract: 本发明涉及一种远程电子数据取证方法及系统,该方法中包括:将被取证机器中需要进行取证分析的检材映射为镜像文件;将被取证机器中需要进行远程取证分析的检材对应的镜像文件挂载为共享文件;取证机器中的取证应用通过网络共享访问并加载共享文件中的镜像文件;被取证机器接收到文件读取请求后,由应用态向内核态的文件系统请求数据;被取证机器内核态的文件系统调用对应的文件系统驱动模块;被取证机器的文件系统驱动模块将读取镜像文件的文件读取请求重定向到读取文件系统中对应检材;被取证机器对重定向的检材进行读取并返回至取证机器。本发明可以实现跨机器远程访问电子数据,可以实现多人协同并行取证分析。

Patent Agency Ranking