-
公开(公告)号:CN110764781A
公开(公告)日:2020-02-07
申请号:CN201911034106.2
申请日:2019-10-29
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F8/41 , G06F16/955
Abstract: 本发明涉及一种自动解析论坛网站数据的方法,其中,所述方法包括以下步骤:S1、生成论坛解析插件模板:收集论坛格式样例,生成论坛解析插件模板并存储在论坛解析插件模板中心库中;S2、筛选论坛解析插件模板:获取待解析论坛网站的源码,根据源码从论坛解析插件模板中心库中筛选出合适的论坛解析插件模板;S3、解析论坛网站数据:根据筛选好的论坛解析插件模板的解析规则对论坛网站数据进行解析并存储本发明通过对互联网上面的论坛网站的网页数据进行判断,针对特定论坛网站筛选出了指定的论坛解析插件模板,为论坛网站数据的采集工作提供了精确的采集范围,同时更提高了对论坛网站数据采集的效率。