一种基于有向图的文章摘要信息提取算法

    公开(公告)号:CN111651588B

    公开(公告)日:2024-03-05

    申请号:CN202010522574.0

    申请日:2020-06-10

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于有向图的文章摘要信息提取算法,包括以下步骤:1输入需要提取出主要信息的文章,去除无效标记,对文章的每个句子做分词处理,并去除句子中的停用词;2分别计算文章的每个词汇的词频与逆文本频率指数,并计算每个词汇的词频逆文本频率值,然后对所有词汇的词频逆文本频率值进行过滤;3将文章所有句子视为图的节点构建无向图,计算文章中任意两个句子的相似程度,构建邻接矩阵对其进行降噪操作,计算文章集合中每一个句子的邻接度;4进行迭代计算得出每一个句子的中心度;5根据使用者需求,选择最高中心度的一个或一组句子作为文章的摘要;本发明使得提取出的文章摘要准确性更高,大大提高了使用者的阅读效率。

    一种基于有向图的文章摘要信息提取算法

    公开(公告)号:CN111651588A

    公开(公告)日:2020-09-11

    申请号:CN202010522574.0

    申请日:2020-06-10

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于有向图的文章摘要信息提取算法,包括以下步骤:1输入需要提取出主要信息的文章,去除无效标记,对文章的每个句子做分词处理,并去除句子中的停用词;2分别计算文章的每个词汇的词频与逆文本频率指数,并计算每个词汇的词频逆文本频率值,然后对所有词汇的词频逆文本频率值进行过滤;3将文章所有句子视为图的节点构建无向图,计算文章中任意两个句子的相似程度,构建邻接矩阵对其进行降噪操作,计算文章集合中每一个句子的邻接度;4进行迭代计算得出每一个句子的中心度;5根据使用者需求,选择最高中心度的一个或一组句子作为文章的摘要;本发明使得提取出的文章摘要准确性更高,大大提高了使用者的阅读效率。

Patent Agency Ranking