-
公开(公告)号:CN118966210B
公开(公告)日:2025-03-07
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-
公开(公告)号:CN118966210A
公开(公告)日:2024-11-15
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-
公开(公告)号:CN119026601A
公开(公告)日:2024-11-26
申请号:CN202411515203.4
申请日:2024-10-29
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/08 , G06F16/35 , G06F18/10 , G06F18/241
Abstract: 本发明涉及一种基于改进LSTM语义建模的档案关键要素识别与分类方法,属于人工智能领域。本发明为解决当前档案数字化加工中存在的分类精度不足、要素提取效率低下的问题,采用LSTM模型的多层次结构捕捉文本中的局部与长距离语义特征,使得复杂档案内容的理解更加全面;采用自适应学习机制根据不同档案类型动态调整记忆单元的权重,确保在面对不同语义结构时,关键要素识别的精度保持在高水平;结合上下文感知的记忆与遗忘机制,模型在识别关键要素时能够减少噪音干扰,进一步提高分类的准确性。本发明不仅能够应对多样化、复杂化的档案内容,还能在处理大量数据时保持高效运行,极大地提高了档案数字化加工的质量和效率。
-
-