一种基于高斯估计的在线餐饮主标签数据快速提取方法

    公开(公告)号:CN106250522B

    公开(公告)日:2019-11-05

    申请号:CN201610634284.9

    申请日:2016-08-03

    Abstract: 一种基于高斯估计的在线餐饮主标签数据快速提取方法,包括以下步骤:1)获取商铺标签数据,以及用户评分与评论数据,并对商铺标签数据进行预处理;2)针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;3)针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;4)将估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩。本发明提取高斯分布下最大似然口味标签作为用户就餐行为的主选口味标签,提取精度较高且算法复杂度较低,适合实际应用场景。

    一种基于用户行为的社交网络中朋友关系挖掘方法

    公开(公告)号:CN106326345B

    公开(公告)日:2019-11-01

    申请号:CN201610638825.5

    申请日:2016-08-08

    Abstract: 一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:1)通过用户已有社交行为的记录数据,分别建立二分图与有向转移网络,即用户—餐馆和用户—口味;2)根据网络拓扑关系,分别提取关于节点或连边的具有表征两两用户之间社交行为的特征变量;3)采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;4)取10次验证结果的平均值作为模型的最终评价成绩。本发明将人们的社交行为映射到网络中,用网络拓扑特征反映社交行为的共性变量,使得预测用户之间朋友关系的结果具有较高精确度,既有利于引导用户寻找合适的新朋友,也有助于商家推荐更有价值的信息。

    一种基于高斯估计的在线餐饮主标签数据快速提取方法

    公开(公告)号:CN106250522A

    公开(公告)日:2016-12-21

    申请号:CN201610634284.9

    申请日:2016-08-03

    Abstract: 一种基于高斯估计的在线餐饮主标签数据快速提取方法,包括以下步骤:1)获取商铺标签数据,以及用户评分与评论数据,并对商铺标签数据进行预处理;2)针对每个用户,将其各标签的评分数据集求得高斯分布的平均值与方差,即该用户在该标签下的评分高斯分布;3)针对每个用户,将每次商铺的各个标签评分与该标签评分高斯分布作标准化处理,求得最大似然估计作为该次用户去该商铺的目标标签;4)将估计标签、实际完整标签分别和评论数据作测试,取两者匹配率的相对偏差作为模型的最终评价成绩。本发明提取高斯分布下最大似然口味标签作为用户就餐行为的主选口味标签,提取精度较高且算法复杂度较低,适合实际应用场景。

    一种基于用户行为的社交网络中朋友关系挖掘方法

    公开(公告)号:CN106326345A

    公开(公告)日:2017-01-11

    申请号:CN201610638825.5

    申请日:2016-08-08

    Abstract: 一种基于用户行为的社交网络中朋友关系挖掘方法,包括以下步骤:1)通过用户已有社交行为的记录数据,分别建立二分图与有向转移网络,即用户—餐馆和用户—口味;2)根据网络拓扑关系,分别提取关于节点或连边的具有表征两两用户之间社交行为的特征变量;3)采用机器学习分类器模型xgboost,将所有样本数据通过10折交叉验证,训练并构建用户关系预测器模型;4)取10次验证结果的平均值作为模型的最终评价成绩。本发明将人们的社交行为映射到网络中,用网络拓扑特征反映社交行为的共性变量,使得预测用户之间朋友关系的结果具有较高精确度,既有利于引导用户寻找合适的新朋友,也有助于商家推荐更有价值的信息。

    一种基于自适应DBSCAN密度聚类的城市商业圈群簇划分方法

    公开(公告)号:CN107688955A

    公开(公告)日:2018-02-13

    申请号:CN201610638258.3

    申请日:2016-08-03

    Abstract: 一种基于自适应DBSCAN密度聚类的城市商业圈群簇划分方法,包括以下步骤:1)对所有城市的某一种类所有商铺求1-最邻近距离,求得全局DBSCAN聚类半径εG,并计算全体城市所含该类商铺数量分布的上四分位数Q;2)获取城市Ci的所有该类商铺的经纬度数据;3)判断该城市的该类商铺数量是否大于Q家。若大于则单独计算该城市商铺聚类半径εi,MinPts=1进行DBSCAN密度聚类;否则用全局聚类半径εG,MinPts=1进行DBSCAN密度聚类。本发明针对商铺数量规模不同的城市,进行不同的商业圈群簇聚类划分策略,提高了地理位置聚类划分结果的鲁棒性,有效地反映了某一种类商铺在不同城市的商业圈布局特点,有利于后续推荐系统发掘用户行为关于地理位置的兴趣点变化。

Patent Agency Ranking