一种基于LDA主题模型的图书自动分类方法

    公开(公告)号:CN109726286A

    公开(公告)日:2019-05-07

    申请号:CN201811584226.5

    申请日:2018-12-24

    Abstract: 一种基于LDA主题模型的图书自动分类方法,包括:建立分类体系;选取已知类别图书作为训练图书,所有训练图书的标签构成图书标签总集,并为图书标签总集中每个标签分配一个唯一序号;构建、并训练一个多项分布模型,多项分布模型的输入是训练图书包含的图书标签和训练图书类别,输出是在不同类别下图书标签总集中每个标签的概率;从待分类图书中挑选出图书标签,并构成待分类图书的标签集合,然后基于LDA主题模型,采用Gibbs采样方法为待分类图书所包含的每个图书标签采样分配一个类别,当达到收敛后,统计待分类图书所属每个类别的得分,据此获得待分类图书所属类别。本发明属于信息技术领域,能基于LDA主题模型实现图书自动分类。

    一种基于LDA主题模型的图书自动分类方法

    公开(公告)号:CN109726286B

    公开(公告)日:2020-10-16

    申请号:CN201811584226.5

    申请日:2018-12-24

    Abstract: 一种基于LDA主题模型的图书自动分类方法,包括:建立分类体系;选取已知类别图书作为训练图书,所有训练图书的标签构成图书标签总集,并为图书标签总集中每个标签分配一个唯一序号;构建、并训练一个多项分布模型,多项分布模型的输入是训练图书包含的图书标签和训练图书类别,输出是在不同类别下图书标签总集中每个标签的概率;从待分类图书中挑选出图书标签,并构成待分类图书的标签集合,然后基于LDA主题模型,采用Gibbs采样方法为待分类图书所包含的每个图书标签采样分配一个类别,当达到收敛后,统计待分类图书所属每个类别的得分,据此获得待分类图书所属类别。本发明属于信息技术领域,能基于LDA主题模型实现图书自动分类。

Patent Agency Ranking