-
公开(公告)号:CN118467719B
公开(公告)日:2024-10-01
申请号:CN202410663888.0
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/34 , G06F40/58 , G06F40/194
Abstract: 本发明公开了一种基于思维链的跨语言多文档摘要评价方法,属于自然语言处理技术领域。解决了现有技术中传统的跨语言多文档摘要评价方法忽视生成摘要与原文之间的事实一致性导致的评价质量较低的问题;本发明提取给定的源语言文档集合中每个源语言文档的事实性关键信息,提取生成的跨语言多文档摘要中每个摘要的事实性关键信息;对源语言答案和目标语言答案进行平均度量,得到信息覆盖度得分;计算跨语言多文档摘要中提取的所有事实性关键信息即所有陈述的一致性得分的平均值,得到事实一致性分数;将信息覆盖度得分与事实一致性得分进行融合,得到综合评价分数。本发明有效提升了跨语言多文档摘要评价方法的精度和效率,可以应用于摘要评估。
-
公开(公告)号:CN118468864A
公开(公告)日:2024-08-09
申请号:CN202410593263.1
申请日:2024-05-14
Applicant: 哈尔滨工业大学
IPC: G06F40/279 , G06F40/216
Abstract: 一种基于思维链的跨语言多文档摘要生成方法及系统,涉及自然语言处理领域。解决了现有技术中在跨语言的环境下,不同语言间的语法结构、用词习惯以及文化差异都使得跨语言的信息提取和整合变得更加困难的问题。本发明所述的方法包括:步骤一、输入源语言文档集合;步骤二、对步骤一中每篇源文档进行单文档摘要生成,所述单文档摘要生成包括关键信息提取步骤和多信息整合与摘要生成步骤;步骤三、合并步骤二中生成的各篇文档的单文档摘要,采用增量化合并策略生成多文档摘要;步骤四、利用跨语言思维链引导大语言模型生成目标语言多文档摘要,确保信息的流畅表达和准确传达。步骤五、输出目标语言多文档摘要。本发明还适用于学术、新闻等多个领域。
-
公开(公告)号:CN118467719A
公开(公告)日:2024-08-09
申请号:CN202410663888.0
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06F16/34 , G06F40/58 , G06F40/194
Abstract: 本发明公开了一种基于思维链的跨语言多文档摘要评价方法,属于自然语言处理技术领域。解决了现有技术中传统的跨语言多文档摘要评价方法忽视生成摘要与原文之间的事实一致性导致的评价质量较低的问题;本发明提取给定的源语言文档集合中每个源语言文档的事实性关键信息,提取生成的跨语言多文档摘要中每个摘要的事实性关键信息;对源语言答案和目标语言答案进行平均度量,得到信息覆盖度得分;计算跨语言多文档摘要中提取的所有事实性关键信息即所有陈述的一致性得分的平均值,得到事实一致性分数;将信息覆盖度得分与事实一致性得分进行融合,得到综合评价分数。本发明有效提升了跨语言多文档摘要评价方法的精度和效率,可以应用于摘要评估。
-
-