基于分布式文件存储的网站页面内容统计的方法和系统

    公开(公告)号:CN103729479A

    公开(公告)日:2014-04-16

    申请号:CN201410038246.8

    申请日:2014-01-26

    CPC classification number: G06F17/30194 G06F11/3476

    Abstract: 本申请公开基于分布式文件存储的网站页面内容统计的方法和系统,方法:采集访问日志将访问日志存入分布式文件存储数据库中,以小时为单位存储到分布式文件存储数据库中的相应的集合文档中;对存储到分布式文件存储数据库中的访问日志进行分解并找出该访问日志中的有效日志信息,将有效日志信息与该访问日志建立映射关系;对访问日志下的所有有效日志信息进行化简操作,输出化简后的有效日志信息,根据化简后的有效日志信息,输出访问日志下的以访问为主键的点击量和对应的流量中间数据的值,或输出访问日志下的以访问和会话身份为主键的独立访客数量和对应的流量中间数据的值。本发明解决了根据业务类型方便的组合查询条件进行网站的PV、UV统计。

Patent Agency Ranking