一种融合主题模型的图书馆平台语义检索方法

    公开(公告)号:CN115329038A

    公开(公告)日:2022-11-11

    申请号:CN202210917286.4

    申请日:2022-08-01

    Abstract: 本发明涉及信息检索技术领域,具体是一种融合主题模型的图书馆平台语义检索方法,包括对所有被检索的文档进行数据预处理,得到合格的被检索文档;利用布尔模型将用户的检索词语与合格的被检索文档进行匹配,根据匹配结果将文档分类并赋予不同的权重值;利用主题模型对合格的被检索文档进行计算,得到每个文档的主题分布和主题单词的分布;将主题单词的频数分布转换为单词主题分布;计算检索词的单词主题分布与被检索文档的之间的相似性分数;利用文档权重与相似性分数计算检索词与各个被检索文档的联系分数,并根据联系分数进行排序后将查询结果返回给用户。本发明可以大大提高图书馆平台语义检索效率,有效满足用户检索知识服务的需求。

Patent Agency Ranking