一种基于改进PageRank算法的用户偏好挖掘方法

    公开(公告)号:CN109902214A

    公开(公告)日:2019-06-18

    申请号:CN201910118231.5

    申请日:2019-02-15

    Abstract: 本发明涉及一种基于改进PageRank算法的用户偏好挖掘方法,利用用户的历史上网日志数据,通过改进的PageRank算法挖掘用户的偏好,能够提高用户偏好挖掘的准确率与召回率。该方法包括以下步骤:检查输入数据格式,提取用户上网过程中的兴趣点集合和上网时长集合;分析兴趣点集合和上网时长集合,确定用户访问兴趣点的频次、时长以及自转移参数;以兴趣点的频次、时长以及自转移参数为输入,通过自定义函数计算用户对兴趣点的关注度;将用户对兴趣点的关注度引入到PageRank算法中,计算每个兴趣点的IR值(兴趣点重要性得分,值域为0-1);对兴趣点的IR值进行迭代计算,当满足迭代终止条件时,输出所有兴趣点的IR值;最后选取IR值靠前的Top-K个兴趣点作为用户偏好。

    一种面向混合属性数据集的密度峰值聚类方法

    公开(公告)号:CN109919227A

    公开(公告)日:2019-06-21

    申请号:CN201910171730.0

    申请日:2019-03-07

    Abstract: 本发明涉及一种面向混合属性数据集的密度峰值聚类方法,属于数据挖掘技术领域。该方法具体包括:S1:获取数据,并对其进行预处理;S2:计算样本点间的混合属性距离;S3:采用两次残差分析方法得到类簇中心点;S4:以遗传算法根据适应度函数迭代更新获取最优截断距离;S5:将其他样本点,按到最近邻的更高密度对象的最小距离,划分到相应的簇中,实现聚类。本发明改进了数据样本点间的混合属性距离计算,使密度峰值聚类算法能够适用于混合属性数据集。

    一种基于改进PageRank算法的用户偏好挖掘方法

    公开(公告)号:CN109902214B

    公开(公告)日:2021-06-08

    申请号:CN201910118231.5

    申请日:2019-02-15

    Abstract: 本发明涉及一种基于改进PageRank算法的用户偏好挖掘方法,利用用户的历史上网日志数据,通过改进的PageRank算法挖掘用户的偏好,能够提高用户偏好挖掘的准确率与召回率。该方法包括以下步骤:检查输入数据格式,提取用户上网过程中的兴趣点集合和上网时长集合;分析兴趣点集合和上网时长集合,确定用户访问兴趣点的频次、时长以及自转移参数;以兴趣点的频次、时长以及自转移参数为输入,通过自定义函数计算用户对兴趣点的关注度;将用户对兴趣点的关注度引入到PageRank算法中,计算每个兴趣点的IR值(兴趣点重要性得分,值域为0‑1);对兴趣点的IR值进行迭代计算,当满足迭代终止条件时,输出所有兴趣点的IR值;最后选取IR值靠前的Top‑K个兴趣点作为用户偏好。

Patent Agency Ranking