面向决策大模型的多级异构内存协同调度方法

    公开(公告)号:CN119576555A

    公开(公告)日:2025-03-07

    申请号:CN202411655388.9

    申请日:2024-11-19

    Abstract: 本发明提供一种面向决策大模型的多级异构内存协同调度方法,包括获取异构内存系统的硬件配置信息和初始状态信息,基于爱尔朗分布族构建突发访存模型,结合自适应分层采样获取动态访存特征;采用多维效能度量和层级亲和度矩阵表征内存系统状态;接着基于广义极值理论预测负载特征,构建增广拉格朗日优化模型生成资源分配方案;通过帕累托优化算法制定数据迁移策略;引入汤普森采样的动态参数调整和基于组合预警指标的异常处理机制。本发明能够精确刻画访存特征、优化资源分配、降低迁移开销,提升决策大模型训练效率。

    基于卷积的大模型微调加速方法及装置

    公开(公告)号:CN119006959B

    公开(公告)日:2025-01-21

    申请号:CN202411455251.9

    申请日:2024-10-17

    Inventor: 胡庆浩 程健

    Abstract: 本公开涉及人工智能领域,提供一种基于卷积的大模型微调加速方法及装置,所述方法包括:获取经过预训练的大模型和微调训练数据;在所述大模型的自注意力模块中引入卷积模块,得到初始微调模型;在固定所述大模型的参数的条件下,利用所述微调训练数据,对所述初始微调模型进行训练,得到微调训练模型;基于所述微调训练模型,得到经过微调的大模型。本公开可以解决对大模型进行微调训练可能会遇到训练内存占用高、训练速度慢、预训练知识遗忘的问题,实现模型对微调训练数据的加速学习,优化模型在微调训练数据所属的任务或领域中的表现。

    面向轻量卷积神经网络的训练后量化方法、装置

    公开(公告)号:CN118643878B

    公开(公告)日:2024-11-15

    申请号:CN202411097720.4

    申请日:2024-08-12

    Abstract: 本发明公开了一种面向轻量卷积神经网络的训练后量化方法、装置,该方法包括读取图像数据;构建浮点模型和量化后模型,基于随机预处理和打乱顺序后的图像批次,逐块地对浮点模型和量化后模型中的每个模型块进行输出特征图的重建,并计算输出特征图重建的损失;基于特征图重建的损失,对量化后模型的每个模型块的批归一化参数和量化参数进行梯度更新和学习。本发明通过对图像数据进行逐块地预处理和随机打乱顺序,提高了模型对输入数据的泛化能力,避免了模型过拟合;通过逐块学习并更新批归一化层参数、权重缩放因子和激活缩放因子,可以在量化过程中细致调整模型参数,在低比特量化下仍保持较高的模型精度。

    面向轻量卷积神经网络的训练后量化方法、装置

    公开(公告)号:CN118643878A

    公开(公告)日:2024-09-13

    申请号:CN202411097720.4

    申请日:2024-08-12

    Abstract: 本发明公开了一种面向轻量卷积神经网络的训练后量化方法、装置,该方法包括读取图像数据;构建浮点模型和量化后模型,基于随机预处理和打乱顺序后的图像批次,逐块地对浮点模型和量化后模型中的每个模型块进行输出特征图的重建,并计算输出特征图重建的损失;基于特征图重建的损失,对量化后模型的每个模型块的批归一化参数和量化参数进行梯度更新和学习。本发明通过对图像数据进行逐块地预处理和随机打乱顺序,提高了模型对输入数据的泛化能力,避免了模型过拟合;通过逐块学习并更新批归一化层参数、权重缩放因子和激活缩放因子,可以在量化过程中细致调整模型参数,在低比特量化下仍保持较高的模型精度。

    可调节量化位宽的神经网络量化与压缩的方法及装置

    公开(公告)号:CN107480770B

    公开(公告)日:2020-07-28

    申请号:CN201710624244.0

    申请日:2017-07-27

    Abstract: 本发明涉及神经网络技术领域,具体提出一种卷积神经网络量化与压缩的方法及装置。旨在解决现有对神经网络量化与压缩的方法对网络性能造成较大损失的问题。本发明的方法包括获取原始卷积神经网络的权值张量和输入特征张量,并基于预先设定的量化位宽,对权值张量和输入特征张量进行定点量化,并将得到的权值定点表示张量以及输入特征定点表示张量替换原来的权值张量和输入特征张量,得到对原始卷积神经网络量化与压缩后的新的卷积神经网络。本发明能够根据不同的任务需要灵活地调整位宽,无需调整算法结构和网络结构即可实现对卷积神经网络的量化与压缩,减少对内存以及存储资源的占用。本发明还提出一种存储装置和处理装置,具有上述有益效果。

Patent Agency Ranking