-
公开(公告)号:CN111125349A
公开(公告)日:2020-05-08
申请号:CN201911301631.6
申请日:2019-12-17
Applicant: 辽宁大学
IPC: G06F16/34 , G06F40/284 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q10/06
Abstract: 一种基于词频和语义的图模型文本摘要生成方法。其步骤如下:1)将文本中的句子进行分词,并进行词性标注。2)对词项进行过滤,只保留特定词性的词项。3)利用Word2Vec模型和BM25算法训练词向量,形成特征词向量集,进而表示句子,构建句子-词文本矩阵。4)通过文本矩阵,构建文本无向图模型。5)利用TextRank算法进行句子结点权值的迭代计算,直至收敛,选取TOP-K句子生成文本摘要。6)实验结果表明,相比传统鉴于文本单一词频特征和基于文本语义特征的文本自动摘要方法,本文方法在最佳调节因子组合下,取得了更高的Rouge值,证明本文方法有效整合了文本词频和语义特征,进而通过基于上下文信息的TextRank算法提高了摘要生成的准确率。