一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质

    公开(公告)号:CN115114428A

    公开(公告)日:2022-09-27

    申请号:CN202210673842.8

    申请日:2022-06-15

    Abstract: 一种基于主题信息的新闻文本摘要获取方法、装置、获取器和存储介质,涉及自然语言处理技术领域。解决了现有生成式文本摘要技术在生成的时候并没有主动地去关注这些潜在的主题信息,导致在生成过程中失去部分重要信息的问题。所述方法包括:对新闻文本进行清理,去除所述新闻文本中无用的符号和信息;利用公开语料库进行主题模型的训练,获取主题语义矩阵;根据获取的主题语义矩阵结合深度学习神经网络建立新闻文本的专用生成式摘要模型,并利用公开数据集训练模型,获取数据集训练模型;将新闻文本的清洗步骤中处理的文本输入至数据集训练模型,利用主题信息进行指导摘要生成,获得摘要结果。本发明应用于新闻信息处理技术领域。

    一种基于图模型和词嵌入模型面向新闻领域的关键词抽取方法

    公开(公告)号:CN115034216A

    公开(公告)日:2022-09-09

    申请号:CN202210606979.1

    申请日:2022-05-31

    Abstract: 本发明提出了一种基于图模型和词嵌入模型面向新闻领域的关键词抽取方法,本发明首先需要将新闻文本进行清洗,去除其中无用信息;然后通过文本处理模块,得到新闻文本中的潜在关键词和词频信息;之后采用图模型和预训练的词嵌入模型对关键词进行语义空间映射,最后融合前述两个模型对关键词的排序分布获得最后关键的分布,从而获得新闻文本关键词;本发明能够改进新闻文本关键词提取的精度,进一步提高舆情分析系统在针对新闻文本分析时内容检索的准确性,更为全面地覆盖新闻文本的主要信息,节省人工复核的时间。

Patent Agency Ranking