一种基于改进LSTM语义建模的档案关键要素识别与分类方法

    公开(公告)号:CN119026601A

    公开(公告)日:2024-11-26

    申请号:CN202411515203.4

    申请日:2024-10-29

    Abstract: 本发明涉及一种基于改进LSTM语义建模的档案关键要素识别与分类方法,属于人工智能领域。本发明为解决当前档案数字化加工中存在的分类精度不足、要素提取效率低下的问题,采用LSTM模型的多层次结构捕捉文本中的局部与长距离语义特征,使得复杂档案内容的理解更加全面;采用自适应学习机制根据不同档案类型动态调整记忆单元的权重,确保在面对不同语义结构时,关键要素识别的精度保持在高水平;结合上下文感知的记忆与遗忘机制,模型在识别关键要素时能够减少噪音干扰,进一步提高分类的准确性。本发明不仅能够应对多样化、复杂化的档案内容,还能在处理大量数据时保持高效运行,极大地提高了档案数字化加工的质量和效率。

    基于改进的BIRCH算法的数字档案分类系统

    公开(公告)号:CN118964703A

    公开(公告)日:2024-11-15

    申请号:CN202411433979.1

    申请日:2024-10-15

    Abstract: 本发明涉及一种基于改进的BIRCH算法的数字档案分类系统,属于计算机软件领域。本发明为解决传统档案管理系统在面对海量档案数据时,分类实时性不足、分类标准难以适应动态变化以及大规模数据处理效率低下等问题,通过引入在线聚类机制,在新数据输入时实时更新聚类结果,无需重新扫描整个数据集。本发明改进了BIRCH算法的聚类特征树(CF树)更新策略,BIRCH算法进行一次全文扫描,将扫描结果生成的CF树保存以便后续使用,从而有效地对新输入的数字档案进行分类。与传统方法相比,这种优化不仅提高了系统的扩展性,还显著减少了计算资源的消耗,提升了分类的实时性。

Patent Agency Ranking