基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品

    公开(公告)号:CN118886453B

    公开(公告)日:2024-11-29

    申请号:CN202411376160.6

    申请日:2024-09-29

    Abstract: 本公开涉及一种基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品,所述基于低秩量化大模型的预测方法包括:获取预测模型,其中,预测模型为大模型;通过将预测模型中的线性层的参数进行低秩分解,得到第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵;基于第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵,构建与线性层对应的量化低秩模块,其中,量化低秩模块依次包含第一激活量化层、第一线性层、尺度缩放层、第二激活量化层、和第二线性层;通过将预测模型中的线性层替换为量化低秩模块,得到压缩后的预测模型;将输入数据输入到压缩后的预测模型,得到与输入数据对应的预测结果。能够解决模型预测推理速度低下的问题。

    基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品

    公开(公告)号:CN118886453A

    公开(公告)日:2024-11-01

    申请号:CN202411376160.6

    申请日:2024-09-29

    Abstract: 本公开涉及一种基于低秩量化大模型的预测方法、装置、电子设备、存储介质和计算机程序产品,所述基于低秩量化大模型的预测方法包括:获取预测模型,其中,预测模型为大模型;通过将预测模型中的线性层的参数进行低秩分解,得到第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵;基于第一低秩矩阵、第二低秩矩阵、和第三低秩矩阵,构建与线性层对应的量化低秩模块,其中,量化低秩模块依次包含第一激活量化层、第一线性层、尺度缩放层、第二激活量化层、和第二线性层;通过将预测模型中的线性层替换为量化低秩模块,得到压缩后的预测模型;将输入数据输入到压缩后的预测模型,得到与输入数据对应的预测结果。能够解决模型预测推理速度低下的问题。

    大模型微调方法、装置、设备、介质及程序产品

    公开(公告)号:CN118673999B

    公开(公告)日:2024-12-06

    申请号:CN202411141783.5

    申请日:2024-08-20

    Abstract: 本申请提供一种大模型微调方法、装置、设备、介质及程序产品,涉及人工智能技术领域。所述方法包括:对大模型中的每个自注意力层,构建重参数化因子;重参数化因子的数量为多个;重参数化因子为多头权重;基于重参数化因子,构建静态多头自注意力权重;基于静态多头自注意力权重与初始自注意力图,确定第一微调模块;基于目标前馈神经网络层与低秩适配器参数,确定第二微调模块;低秩适配器参数包括多个低秩矩阵;基于第一微调模块与第二微调模块,在训练数据上进行大模型部分参数的调整。本申请提供的大模型微调方法、装置、设备、介质及程序产品,可以将线性层的重参数化手段和注意力机制的微调结合起来,能够全面又高效地进行大模型微调。

    大模型微调方法、装置、设备、介质及程序产品

    公开(公告)号:CN118673999A

    公开(公告)日:2024-09-20

    申请号:CN202411141783.5

    申请日:2024-08-20

    Abstract: 本申请提供一种大模型微调方法、装置、设备、介质及程序产品,涉及人工智能技术领域。所述方法包括:对大模型中的每个自注意力层,构建重参数化因子;重参数化因子的数量为多个;重参数化因子为多头权重;基于重参数化因子,构建静态多头自注意力权重;基于静态多头自注意力权重与初始自注意力图,确定第一微调模块;基于目标前馈神经网络层与低秩适配器参数,确定第二微调模块;低秩适配器参数包括多个低秩矩阵;基于第一微调模块与第二微调模块,在训练数据上进行大模型部分参数的调整。本申请提供的大模型微调方法、装置、设备、介质及程序产品,可以将线性层的重参数化手段和注意力机制的微调结合起来,能够全面又高效地进行大模型微调。

    社会事件分类方法及装置
    7.
    发明公开

    公开(公告)号:CN114511729A

    公开(公告)日:2022-05-17

    申请号:CN202111617494.4

    申请日:2021-12-27

    Abstract: 本发明提供一种社会事件分类方法及装置,获取目标数据集;将目标数据集输入社会事件分类模型,获取社会事件分类模型输出的目标数据集对应的社会事件分类结果;其中,目标数据集包括图像集和文本集,图像集中的部分图像与文本集中的部分文本具有对应关系;社会事件分类模型,是基于样本数据集以及样本数据集对应的社会事件分类结果进行训练得到的;样本数据集包括样本图像集和样本文本集,样本图像集中的部分样本图像与样本文本集中的部分样本文本具有对应关系。本发明提供的社会事件分类方法及装置,能更准确、更高效的对包括完备的多模态数据以及不完备的多模态数据的混合数据进行社会事件分类。

Patent Agency Ranking