-
公开(公告)号:CN114911919A
公开(公告)日:2022-08-16
申请号:CN202210508238.X
申请日:2022-05-10
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/335 , G06F40/216 , G06F40/242 , G06F40/289
Abstract: 本发明公开了一种面向兴趣挖掘的多特征改进TextRank关键词提取方法,包括以下步骤,获取行为数据,并根据所述行为数据生成主题备选词集合;计算所述主题备选词集合中各个备选词的词频:根据所述词频计算词频重要性,并根据所述词频重要性构建重要性字典;基于重要性字典对预先构建TextRank词网络图进行迭代直至收敛,得到最终的备选词TextRank值;根据所述最终的备选词TextRank值,提取关键词;本发明综合考虑了用户兴趣偏移,并将其融入了词频计算,进而提高了挖掘用户兴趣主题的准确性。