一种基于改进PageRank算法的用户偏好挖掘方法

    公开(公告)号:CN109902214A

    公开(公告)日:2019-06-18

    申请号:CN201910118231.5

    申请日:2019-02-15

    Abstract: 本发明涉及一种基于改进PageRank算法的用户偏好挖掘方法,利用用户的历史上网日志数据,通过改进的PageRank算法挖掘用户的偏好,能够提高用户偏好挖掘的准确率与召回率。该方法包括以下步骤:检查输入数据格式,提取用户上网过程中的兴趣点集合和上网时长集合;分析兴趣点集合和上网时长集合,确定用户访问兴趣点的频次、时长以及自转移参数;以兴趣点的频次、时长以及自转移参数为输入,通过自定义函数计算用户对兴趣点的关注度;将用户对兴趣点的关注度引入到PageRank算法中,计算每个兴趣点的IR值(兴趣点重要性得分,值域为0-1);对兴趣点的IR值进行迭代计算,当满足迭代终止条件时,输出所有兴趣点的IR值;最后选取IR值靠前的Top-K个兴趣点作为用户偏好。

    一种基于改进PageRank算法的用户偏好挖掘方法

    公开(公告)号:CN109902214B

    公开(公告)日:2021-06-08

    申请号:CN201910118231.5

    申请日:2019-02-15

    Abstract: 本发明涉及一种基于改进PageRank算法的用户偏好挖掘方法,利用用户的历史上网日志数据,通过改进的PageRank算法挖掘用户的偏好,能够提高用户偏好挖掘的准确率与召回率。该方法包括以下步骤:检查输入数据格式,提取用户上网过程中的兴趣点集合和上网时长集合;分析兴趣点集合和上网时长集合,确定用户访问兴趣点的频次、时长以及自转移参数;以兴趣点的频次、时长以及自转移参数为输入,通过自定义函数计算用户对兴趣点的关注度;将用户对兴趣点的关注度引入到PageRank算法中,计算每个兴趣点的IR值(兴趣点重要性得分,值域为0‑1);对兴趣点的IR值进行迭代计算,当满足迭代终止条件时,输出所有兴趣点的IR值;最后选取IR值靠前的Top‑K个兴趣点作为用户偏好。

Patent Agency Ranking