-
公开(公告)号:CN117874220A
公开(公告)日:2024-04-12
申请号:CN202410055343.1
申请日:2024-01-15
Applicant: 东南大学
IPC: G06F16/34 , G06F16/31 , G06F40/279 , G06F40/216 , G06F40/30 , G06N3/0455 , G06N3/042 , G06N3/084
Abstract: 本发明公开了一种基于关键事件的多文档摘要生成方法,首先通过互联网采集同一主题下的多篇媒体文章,并在文档集合基础上按人工规则生成标准摘要构造出样本数据集;然后对数据集进行预处理,生成训练模型的输入数据;接着构建基于关键事件融合的序列到序列多文档摘要生成模型;最后基于训练完毕后的模型进行输出模型的构建,并利用输出模型对待进行摘要的文档集合进行自动摘要生成。本发明利用事件抽取技术提取出多个文档中的包含动静态信息的关键事件来挖掘出多篇文档的关系,能够多层次地对摘要生成过程进行引导,从而提高摘要结果的信息覆盖度与事实一致性,突出原文中的事件信息,增强摘要逻辑性。
-
公开(公告)号:CN115455162A
公开(公告)日:2022-12-09
申请号:CN202211113668.8
申请日:2022-09-14
Applicant: 东南大学
Abstract: 本发明公开了一种层次胶囊与多视图信息融合的答案句子选择方法与装置。首先,对互联网中的包含多个答案的问题文本进行采集和预处理;接着,采用层次胶囊网络,通过其渐进聚合的特征,对编码输出的表征进行信息聚合和单词聚合,保证了有效信息的准确传递,且能使用同一特征进行参数传递;然后,为了解决微调步骤的不稳定性和使用预训练模型的最终输出仅能预测单一标签的问题,通过使用多视图信息融合方法,计算整个BERT编码中间层输出的权重来对学习信息进行加权。本发明能够改善以往答案句子选择方法中忽略了模型内部多层中间输出对答案句子选择的影响、仅能预测单一结果等问题,进而提升答案句子选择的准确性和高效性。
-