-
公开(公告)号:CN105138537B
公开(公告)日:2018-12-07
申请号:CN201510398058.0
申请日:2015-07-08
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于自信息的跨学科领域共现主题发现方法,该方法具体步骤如下:(1)、数据收集:收集高引文献作者关于其科研成功的自评文档集;(2)、数据处理:提取和数字化自评中的正文部分;(3)、抽取候选低频主题词;(4)、计算低频主题评价系数;(5)、设定低频主题词评价系数的阈值;(6)、过滤低频主题词。该方法为主题发现的相关研究提供了新的思路。不仅高频词与主题有紧密关系,低频词也是一种可以利用的资源。该方法可以应用到评价类文档集的主题发现,例如从自传题材中提取人物的共同经历、从股票评论中提取评价股票的共同指标,从而实现不同学科领域文档集中的共现主题提取。
-
公开(公告)号:CN105138537A
公开(公告)日:2015-12-09
申请号:CN201510398058.0
申请日:2015-07-08
Applicant: 上海大学
IPC: G06F17/30
CPC classification number: G06F17/30684 , G06F17/30731
Abstract: 本发明公开了一种基于自信息的跨学科领域共现主题发现方法,该方法具体步骤如下:(1)、数据收集:收集高引文献作者关于其科研成功的自评文档集;(2)、数据处理:提取和数字化自评中的正文部分;(3)、抽取候选低频主题词;(4)、计算低频主题评价系数;(5)、设定低频主题词评价系数的阈值;(6)、过滤低频主题词。该方法为主题发现的相关研究提供了新的思路。不仅高频词与主题有紧密关系,低频词也是一种可以利用的资源。该方法可以应用到评价类文档集的主题发现,例如从自传题材中提取人物的共同经历、从股票评论中提取评价股票的共同指标,从而实现不同学科领域文档集中的共现主题提取。
-