-
公开(公告)号:CN109933739A
公开(公告)日:2019-06-25
申请号:CN201910153960.4
申请日:2019-03-01
Applicant: 重庆邮电大学移通学院
IPC: G06F16/957
Abstract: 本发明属于网页排序技术领域,公开了一种基于转移概率的网页排序方法及系统,所述基于转移概率的网页排序系统包括:网页数据爬取模块、中央控制模块、PR值计算模块、关联模块、网页内容监测模块、排序优化模块、显示模块。本发明通过网页内容监测模块可以在不同时刻获取一网址对应的网页内容,并比较这两个时刻获取的网页内容,判断该网址对应的网页内容是否发生变更。利用该方案监测网页变化需要较少的工作量,监测效率高,可以节省系统资源;同时,本发明通过排序优化模块改进后的排序算法在Solr搜索引擎中应用良好,提高了网页排序质量和用户体验;考虑了PageRank算法本身的不合理性,改进了算法中的权值分配,可以有效避免主题漂移。