-
公开(公告)号:CN118966210A
公开(公告)日:2024-11-15
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-
公开(公告)号:CN118966210B
公开(公告)日:2025-03-07
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-