-
公开(公告)号:CN107688652A
公开(公告)日:2018-02-13
申请号:CN201710775894.5
申请日:2017-08-31
Applicant: 苏州大学
Abstract: 本发明涉及一种面向互联网新闻事件的演化式摘要生成方法,包括:输入相关新闻文档集合;通过LDA主题模型将文档表示为主题特征向量,所述主题特征向量的维数为第一预定值;将表示为主题特征向量的文档进行聚类,其中,每一类代表一个主题;计算每一个主题中各个文档的本地得分;计算每一个主题中各个文档的全局得分;计算每一个主题中各个文档的最终得分;从每一个主题中抽取得分高的文档标题按时间排序作为摘要;输出摘要。上述面向互联网新闻事件的演化式摘要生成方法保证抽取的摘要具有动态演化性且前后连贯,可读性强,实验结果表明该系统和传统多文档摘要系统相比,在冗余度,连贯性和动态演化性等几个方面有较大提升。
-
公开(公告)号:CN107688652B
公开(公告)日:2020-12-29
申请号:CN201710775894.5
申请日:2017-08-31
Applicant: 苏州大学
IPC: G06F16/35 , G06F16/958 , G06F40/258
Abstract: 本发明涉及一种面向互联网新闻事件的演化式摘要生成方法,包括:输入相关新闻文档集合;通过LDA主题模型将文档表示为主题特征向量,所述主题特征向量的维数为第一预定值;将表示为主题特征向量的文档进行聚类,其中,每一类代表一个主题;计算每一个主题中各个文档的本地得分;计算每一个主题中各个文档的全局得分;计算每一个主题中各个文档的最终得分;从每一个主题中抽取得分高的文档标题按时间排序作为摘要;输出摘要。上述面向互联网新闻事件的演化式摘要生成方法保证抽取的摘要具有动态演化性且前后连贯,可读性强,实验结果表明该系统和传统多文档摘要系统相比,在冗余度,连贯性和动态演化性等几个方面有较大提升。
-