-
公开(公告)号:CN102262661B
公开(公告)日:2013-06-12
申请号:CN201110200145.2
申请日:2011-07-18
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于k阶混合马尔可夫模型的Web页面访问预测方法,首先收集和整理Web服务器访问日志数据,识别客户端和用户,排除无意义的访问数据;再识别用户会话,组建Web日志数据库;并根据预测目标从数据库中选取日志数据,以会话为单位组织(k+1)元组,用于训练k阶混合马尔可夫模型;采用最大期望算法学习和校准k阶混合马尔可夫模型的参数集;根据目标用户页面访问操作识别会话,应用上述模型预测用户下一步访问的Web页面。本发明可向用户推荐需要访问的页面,减少页面访问的延迟,优化用户体验;从Web服务器角度可以改善Web页面的组织结构,指导搜索引擎的结果排序,改进页面缓存机制,从而提高服务质量。
-
公开(公告)号:CN102262661A
公开(公告)日:2011-11-30
申请号:CN201110200145.2
申请日:2011-07-18
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于k阶混合马尔可夫模型的Web页面访问预测方法,首先收集和整理Web服务器访问日志数据,识别客户端和用户,排除无意义的访问数据;再识别用户会话,组建Web日志数据库;并根据预测目标从数据库中选取日志数据,以会话为单位组织(k+1)元组,用于训练k阶混合马尔可夫模型;采用最大期望算法学习和校准k阶混合马尔可夫模型的参数集;根据目标用户页面访问操作识别会话,应用上述模型预测用户下一步访问的Web页面。本发明可向用户推荐需要访问的页面,减少页面访问的延迟,优化用户体验;从Web服务器角度可以改善Web页面的组织结构,指导搜索引擎的结果排序,改进页面缓存机制,从而提高服务质量。
-