-
公开(公告)号:CN108596444B
公开(公告)日:2021-06-29
申请号:CN201810284916.2
申请日:2018-04-02
Applicant: 清华大学
Abstract: 本发明公开了一种基于多元化策略的大规模社会网络用户抽样的方法及装置,其中,方法包括以下步骤:通过效用函数抽取多名用户代表;根据多名用户代表的每个用户代表的属性将多名用户代表分为多个属性组,以得到属性组代表程度的模型;获取效用函数的最大值,以从多个属性组中选出代表用户;根据代表用户利用多元化策略抽样选出代表度最差组。该方法可以有效的减小网络的数据规模,使数据处理规模变的容易处理,同时也有助于去除没有代表性的用户,集中研究网络中更具有价值的用户群体,进而有效提高抽样的准确率,同时在时间复杂度上也表现的非常高效。
-
公开(公告)号:CN108596444A
公开(公告)日:2018-09-28
申请号:CN201810284916.2
申请日:2018-04-02
Applicant: 清华大学
Abstract: 本发明公开了一种基于多元化策略的大规模社会网络用户抽样的方法及装置,其中,方法包括以下步骤:通过效用函数抽取多名用户代表;根据多名用户代表的每个用户代表的属性将多名用户代表分为多个属性组,以得到属性组代表程度的模型;获取效用函数的最大值,以从多个属性组中选出代表用户;根据代表用户利用多元化策略抽样选出代表度最差组。该方法可以有效的减小网络的数据规模,使数据处理规模变的容易处理,同时也有助于去除没有代表性的用户,集中研究网络中更具有价值的用户群体,进而有效提高抽样的准确率,同时在时间复杂度上也表现的非常高效。
-