基于自信息的跨学科领域共现主题发现方法

    公开(公告)号:CN105138537B

    公开(公告)日:2018-12-07

    申请号:CN201510398058.0

    申请日:2015-07-08

    Applicant: 上海大学

    Abstract: 本发明公开了一种基于自信息的跨学科领域共现主题发现方法,该方法具体步骤如下:(1)、数据收集:收集高引文献作者关于其科研成功的自评文档集;(2)、数据处理:提取和数字化自评中的正文部分;(3)、抽取候选低频主题词;(4)、计算低频主题评价系数;(5)、设定低频主题词评价系数的阈值;(6)、过滤低频主题词。该方法为主题发现的相关研究提供了新的思路。不仅高频词与主题有紧密关系,低频词也是一种可以利用的资源。该方法可以应用到评价类文档集的主题发现,例如从自传题材中提取人物的共同经历、从股票评论中提取评价股票的共同指标,从而实现不同学科领域文档集中的共现主题提取。

    基于自信息的跨学科领域共现主题发现方法

    公开(公告)号:CN105138537A

    公开(公告)日:2015-12-09

    申请号:CN201510398058.0

    申请日:2015-07-08

    Applicant: 上海大学

    CPC classification number: G06F17/30684 G06F17/30731

    Abstract: 本发明公开了一种基于自信息的跨学科领域共现主题发现方法,该方法具体步骤如下:(1)、数据收集:收集高引文献作者关于其科研成功的自评文档集;(2)、数据处理:提取和数字化自评中的正文部分;(3)、抽取候选低频主题词;(4)、计算低频主题评价系数;(5)、设定低频主题词评价系数的阈值;(6)、过滤低频主题词。该方法为主题发现的相关研究提供了新的思路。不仅高频词与主题有紧密关系,低频词也是一种可以利用的资源。该方法可以应用到评价类文档集的主题发现,例如从自传题材中提取人物的共同经历、从股票评论中提取评价股票的共同指标,从而实现不同学科领域文档集中的共现主题提取。

Patent Agency Ranking