一种基于LDA主题模型的图书自动分类方法

    公开(公告)号:CN109726286A

    公开(公告)日:2019-05-07

    申请号:CN201811584226.5

    申请日:2018-12-24

    Abstract: 一种基于LDA主题模型的图书自动分类方法,包括:建立分类体系;选取已知类别图书作为训练图书,所有训练图书的标签构成图书标签总集,并为图书标签总集中每个标签分配一个唯一序号;构建、并训练一个多项分布模型,多项分布模型的输入是训练图书包含的图书标签和训练图书类别,输出是在不同类别下图书标签总集中每个标签的概率;从待分类图书中挑选出图书标签,并构成待分类图书的标签集合,然后基于LDA主题模型,采用Gibbs采样方法为待分类图书所包含的每个图书标签采样分配一个类别,当达到收敛后,统计待分类图书所属每个类别的得分,据此获得待分类图书所属类别。本发明属于信息技术领域,能基于LDA主题模型实现图书自动分类。

    一种基于用户网站访问记录的图书推荐方法

    公开(公告)号:CN109460518A

    公开(公告)日:2019-03-12

    申请号:CN201811494487.8

    申请日:2018-12-07

    Abstract: 一种基于用户网站访问记录的图书推荐方法,包括:从内容类网站和待推荐的图书阅读网站上获取发布内容,将内容添加到网站内容库中;寻找网站内容库中每条内容记录在待推荐的图书阅读网站上的关联图书,并在内容记录中添加关联图书ID信息;获取所有用户手机在一定时间周期内对内容类网站和待推荐的图书阅读网站的访问记录,写入用户手机内容访问记录表;从用户手机内容访问记录表中提取待推荐用户访问记录,获取待推荐用户在内容类网站上访问过的内容,并判断访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向用户推荐。本发明属于信息技术领域,能基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐。

    一种基于标签的图书推荐方法

    公开(公告)号:CN107437215A

    公开(公告)日:2017-12-05

    申请号:CN201710651464.2

    申请日:2017-08-02

    Abstract: 一种基于标签的图书推荐方法,包括有:步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签;步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书。本发明属于数据业务领域,能充分利用图书所包含的通用标签来为用户挑选符合其偏好的推荐图书。

    一种基于标签的图书推荐方法

    公开(公告)号:CN107437215B

    公开(公告)日:2020-07-24

    申请号:CN201710651464.2

    申请日:2017-08-02

    Abstract: 一种基于标签的图书推荐方法,包括有:步骤一、根据用户的历史阅读图书记录,计算用户对已阅读图书所包含的每个通用标签的偏好值,并从中挑选出多个偏好值最大的通用标签作为用户的偏好标签;步骤二、从用户的每本未阅读图书的通用标签中挑选出用户的偏好标签,并根据用户对通用标签的偏好值,计算用户对未阅读图书的偏好值,以据此向用户推荐图书。本发明属于数据业务领域,能充分利用图书所包含的通用标签来为用户挑选符合其偏好的推荐图书。

    一种为图书添加标签属性的方法

    公开(公告)号:CN107506398A

    公开(公告)日:2017-12-22

    申请号:CN201710651211.5

    申请日:2017-08-02

    Abstract: 一种为图书添加标签属性的方法,包括有:步骤一、挑选一定数量的用户作为样本用户,并提取每个样本用户的历史阅读图书记录,然后从样本用户的历史阅读图书所包含的通用标签中挑选多个标签来分别为每个样本用户构成一个偏好标签集,所有样本用户的偏好标签集构成用户偏好标签集群;步骤二、提取未添加标签图书的所有阅读用户,然后从用户偏好标签集群中寻找所有阅读用户对应的偏好标签集,最后从所有阅读用户的偏好标签集中挑选多个标签作为所述未添加标签图书的标签属性。本发明属于数据业务领域,能自动为图书添加符合其内容的标签属性。

    一种基于LDA主题模型的图书自动分类方法

    公开(公告)号:CN109726286B

    公开(公告)日:2020-10-16

    申请号:CN201811584226.5

    申请日:2018-12-24

    Abstract: 一种基于LDA主题模型的图书自动分类方法,包括:建立分类体系;选取已知类别图书作为训练图书,所有训练图书的标签构成图书标签总集,并为图书标签总集中每个标签分配一个唯一序号;构建、并训练一个多项分布模型,多项分布模型的输入是训练图书包含的图书标签和训练图书类别,输出是在不同类别下图书标签总集中每个标签的概率;从待分类图书中挑选出图书标签,并构成待分类图书的标签集合,然后基于LDA主题模型,采用Gibbs采样方法为待分类图书所包含的每个图书标签采样分配一个类别,当达到收敛后,统计待分类图书所属每个类别的得分,据此获得待分类图书所属类别。本发明属于信息技术领域,能基于LDA主题模型实现图书自动分类。

    一种基于用户网站访问记录的图书推荐方法

    公开(公告)号:CN109460518B

    公开(公告)日:2020-07-24

    申请号:CN201811494487.8

    申请日:2018-12-07

    Abstract: 一种基于用户网站访问记录的图书推荐方法,包括:从内容类网站和待推荐的图书阅读网站上获取发布内容,将内容添加到网站内容库中;寻找网站内容库中每条内容记录在待推荐的图书阅读网站上的关联图书,并在内容记录中添加关联图书ID信息;获取所有用户手机在一定时间周期内对内容类网站和待推荐的图书阅读网站的访问记录,写入用户手机内容访问记录表;从用户手机内容访问记录表中提取待推荐用户访问记录,获取待推荐用户在内容类网站上访问过的内容,并判断访问过的内容在网站内容库中是否存在有关联图书ID信息,如果有,则提取关联图书向用户推荐。本发明属于信息技术领域,能基于用户在各个内容类网站上的访问记录来实现图书的个性化推荐。

    一种为图书添加标签属性的方法

    公开(公告)号:CN107506398B

    公开(公告)日:2020-01-24

    申请号:CN201710651211.5

    申请日:2017-08-02

    Abstract: 一种为图书添加标签属性的方法,包括有:步骤一、挑选一定数量的用户作为样本用户,并提取每个样本用户的历史阅读图书记录,然后从样本用户的历史阅读图书所包含的通用标签中挑选多个标签来分别为每个样本用户构成一个偏好标签集,所有样本用户的偏好标签集构成用户偏好标签集群;步骤二、提取未添加标签图书的所有阅读用户,然后从用户偏好标签集群中寻找所有阅读用户对应的偏好标签集,最后从所有阅读用户的偏好标签集中挑选多个标签作为所述未添加标签图书的标签属性。本发明属于数据业务领域,能自动为图书添加符合其内容的标签属性。

Patent Agency Ranking