-
公开(公告)号:CN110110047A
公开(公告)日:2019-08-09
申请号:CN201910359911.6
申请日:2019-04-30
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/33 , G06F16/335 , G06F16/35
Abstract: 本发明公开了一种基于TF-IDF和领域词典的主题内容聚合分析方法,属于情报信息处理领域。基于TF-IDF获取主题需求词的扩展词集;将其作为检索文本遵循基于领域词典的检索策略完成对资源池中多种类型资源的检索,经过审核进行资源删补,对每种目标资源类型,根据资源的时效性、权威性及相关度进行有序排列和发布。与传统方法相比,本方法通过扩展词集保证了主题内资源的检全率,通过基于领域词典的检索策略和具有针对性的各类型资源排序模型,保证了主题内资源的检准率;通过审核原则保障了主题内资源的质量。易扩展易维护,同时大大降低了主题资源内容聚合的时间和人工成本。
-
公开(公告)号:CN114911919A
公开(公告)日:2022-08-16
申请号:CN202210508238.X
申请日:2022-05-10
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/335 , G06F40/216 , G06F40/242 , G06F40/289
Abstract: 本发明公开了一种面向兴趣挖掘的多特征改进TextRank关键词提取方法,包括以下步骤,获取行为数据,并根据所述行为数据生成主题备选词集合;计算所述主题备选词集合中各个备选词的词频:根据所述词频计算词频重要性,并根据所述词频重要性构建重要性字典;基于重要性字典对预先构建TextRank词网络图进行迭代直至收敛,得到最终的备选词TextRank值;根据所述最终的备选词TextRank值,提取关键词;本发明综合考虑了用户兴趣偏移,并将其融入了词频计算,进而提高了挖掘用户兴趣主题的准确性。
-
公开(公告)号:CN110110047B
公开(公告)日:2021-03-19
申请号:CN201910359911.6
申请日:2019-04-30
Applicant: 中国农业科学院农业信息研究所
IPC: G06F16/33 , G06F16/335 , G06F16/35
Abstract: 本发明公开了一种基于TF‑IDF和领域词典的主题内容聚合分析方法,属于情报信息处理领域。基于TF‑IDF获取主题需求词的扩展词集;将其作为检索文本遵循基于领域词典的检索策略完成对资源池中多种类型资源的检索,经过审核进行资源删补,对每种目标资源类型,根据资源的时效性、权威性及相关度进行有序排列和发布。与传统方法相比,本方法通过扩展词集保证了主题内资源的检全率,通过基于领域词典的检索策略和具有针对性的各类型资源排序模型,保证了主题内资源的检准率;通过审核原则保障了主题内资源的质量。易扩展易维护,同时大大降低了主题资源内容聚合的时间和人工成本。
-
-