一种科技研究热点主题预测方法

    公开(公告)号:CN112650847A

    公开(公告)日:2021-04-13

    申请号:CN201910961978.7

    申请日:2019-10-11

    Abstract: 本发明公开一种科技研究热点主题预测方法,根据与待测主题相关的科技研究主题词表对学科文献进行预处理,得到对应年份的分词文档,并将分词文档转换为二进制向量矩阵;利用频繁项集挖掘算法对二进制向量矩阵进行处理,得到频繁主题集合;对频繁主题集合进行过滤,得到热点主题集合;将热点主题集合转换为时序序列数据,根据时序序列数据,训练多个预测模型,并利用加权处理方法得到主题预测模型;根据主题预测模型预测待测主题出现的频率。本发明文采用基于领域主题词表的词语过滤,较为完善的归纳了科技研究领域特性,采用频繁项集算法对科技研究领域的热点主题进行识别,能够准确地预测未来时间内的热点主题。

    一种科技研究热点主题预测方法

    公开(公告)号:CN112650847B

    公开(公告)日:2023-05-09

    申请号:CN201910961978.7

    申请日:2019-10-11

    Abstract: 本发明公开一种科技研究热点主题预测方法,根据与待测主题相关的科技研究主题词表对学科文献进行预处理,得到对应年份的分词文档,并将分词文档转换为二进制向量矩阵;利用频繁项集挖掘算法对二进制向量矩阵进行处理,得到频繁主题集合;对频繁主题集合进行过滤,得到热点主题集合;将热点主题集合转换为时序序列数据,根据时序序列数据,训练多个预测模型,并利用加权处理方法得到主题预测模型;根据主题预测模型预测待测主题出现的频率。本发明文采用基于领域主题词表的词语过滤,较为完善的归纳了科技研究领域特性,采用频繁项集算法对科技研究领域的热点主题进行识别,能够准确地预测未来时间内的热点主题。

Patent Agency Ranking