基于梯度的Transformer模块化分解方法

    公开(公告)号:CN118586440A

    公开(公告)日:2024-09-03

    申请号:CN202410649049.3

    申请日:2024-05-23

    Abstract: 本发明公开了基于梯度的Transformer模块化分解方法,涉及图像处理和计算机视觉技术领域,该基于梯度的Transformer模块化分解方法,包括以下步骤:步骤一:目标点识别,如算法1描述了基于梯度技术识别单个注意力头中的非目标节点;步骤二;存储不属于目标类模块的节点位置;步骤三:添加非目标类;步骤四:目标类模块化,将事先训练好的Transformer模型分解为一组更小且可重用的模块,通过这一独特的分解过程,生成的模块能够被灵活地重用,以构建全新的、甚至更加精准的Transformer模型,而无需从头开始进行昂贵的训练。这种模块化分解方法不仅提高了模型的灵活性和可重用性,同时降低了模型开发的成本和时间,为深度学习模型的定制和优化提供了一种高效而创新的途径。

    一种基于RAG的智能知识库管理的方法和系统

    公开(公告)号:CN119938820A

    公开(公告)日:2025-05-06

    申请号:CN202411792188.8

    申请日:2024-12-06

    Abstract: 本申请涉及一种基于RAG的智能知识库管理的方法,包括如下步骤:S1、问题检索,S11、问题向量化处理,将用户提问转换为数值向量,系统使用和文本数据相同的预训练的语言模型对问题进行编码,使问题向量化;S12、向量相似性检索;S2、构建知识库,S21、数据提取阶段,即从原始数据源提取知识内容;S22、文档切分,拆分文本数据为词块内容;S23、向量化;S3、答案生成。本申请实施例提供的整体系统,通过利用本系统快速构建向量数据库,实现数据检索,并配合大语言模型生成符合逻辑且完整的答案,大幅缩减了特定领域问题系统的开发周期,极大地方便了用户检索特定问题的时间,使系统回答问题更具备逻辑性和完整性。

Patent Agency Ranking