基于隐马尔科夫模型的关键词识别方法、终端设备及存储介质

    公开(公告)号:CN108170680A

    公开(公告)日:2018-06-15

    申请号:CN201711480960.2

    申请日:2017-12-29

    Abstract: 本发明涉及一种基于隐马尔科夫模型关键词识别方法,包括以下步骤:S1、构建隐马尔科夫模型,隐马尔科夫模型包括五个元素:隐含状态S、可观测状态O、初始状态概率矩阵π、隐含状态转移概率矩阵A和观测状态矩阵B;S2、将目标文章通过分词算法拆分成词语+词性的格式后,输入已经构建好的隐马尔科夫模型中,获得可观测状态序列O,然后将可观测状态序列O输入构建好的隐马尔科夫模型,得到模型μ;S3、利用构建好的隐马尔科夫模型μ和得到的观测状态序列O={O1,O2,….OT},通过维特比算法,计算隐藏状态的最大可能值,从而识别每个词是否为关键词。本发明实现较好的通用性,可同时针对较长文章及短小文章提取关键词,识别的准确性高。

Patent Agency Ranking