大模型微调方法、装置、设备、介质及程序产品

    公开(公告)号:CN118673999A

    公开(公告)日:2024-09-20

    申请号:CN202411141783.5

    申请日:2024-08-20

    Abstract: 本申请提供一种大模型微调方法、装置、设备、介质及程序产品,涉及人工智能技术领域。所述方法包括:对大模型中的每个自注意力层,构建重参数化因子;重参数化因子的数量为多个;重参数化因子为多头权重;基于重参数化因子,构建静态多头自注意力权重;基于静态多头自注意力权重与初始自注意力图,确定第一微调模块;基于目标前馈神经网络层与低秩适配器参数,确定第二微调模块;低秩适配器参数包括多个低秩矩阵;基于第一微调模块与第二微调模块,在训练数据上进行大模型部分参数的调整。本申请提供的大模型微调方法、装置、设备、介质及程序产品,可以将线性层的重参数化手段和注意力机制的微调结合起来,能够全面又高效地进行大模型微调。

    基于掩码图像建模预训练加速模型的图像分类方法和装置

    公开(公告)号:CN118411546A

    公开(公告)日:2024-07-30

    申请号:CN202410344613.0

    申请日:2024-03-25

    Abstract: 本发明提供一种基于掩码图像建模预训练加速模型的图像分类方法和装置,其中方法包括:将待分类图像输入至掩码图像建模预训练加速模型,得到掩码图像建模预训练加速模型输出的待分类图像的图像类别;掩码图像建模预训练加速模型是在视觉转换网络的基础上,应用样本图像集中的多个样本图像进行多阶段的自监督训练得到的,每个阶段的自监督训练过程中所应用的样本图像是从上一阶段的自监督训练过程中所应用的样本图像中筛选得到的,克服了传统方案中因复杂度和数据量提升,导致训练耗费的计算资源、占用的存储空间,以及花费时间增加,模型的训练开销太大的缺陷,减少了训练过程中计算量和数据量的需求,缩减了资源消耗,兼顾了模型性能和训练效率。

    角膜共聚焦图像中菌丝识别方法及装置

    公开(公告)号:CN113591601B

    公开(公告)日:2024-02-02

    申请号:CN202110773694.2

    申请日:2021-07-08

    Abstract: 本发明提供一种角膜共聚焦图像中菌丝识别方法及装置,该方法包括:获取待识别的角膜共聚焦图像;将所述角膜共聚焦图像输入到菌丝‑神经纤维分割模型,根据所述菌丝‑神经纤维分割模型输出预分割结果图;对预分割结果图进行自动修正得到最终分割结果图;根据所述最终分割结果图判断是否存在菌丝。本发明提供的角膜共聚焦图像中菌丝识别方法及装置,通过将角膜共聚焦图像输入到菌丝‑神经纤维分割模型,根据菌丝‑神经纤维分割模型输出预分割结果图,对预分割结果图进行自动修正得到最终分割结果图,根据最终分割结果图判断是否存在菌丝,实现对图像中菌丝和神经纤维的准确区分,由此可以实现角膜共聚焦图像中菌丝的自动化(56)对比文件吕健;陈琦;张凯;蒋莉;唐芬;陈青;蓝倩倩;李兰建;曾思明;徐帆.基于深度学习算法在角膜共聚焦显微镜图像中炎症细胞智能识别的研究.中国临床新医学.2020,(第02期),第1-4页.

    卷积神经网络压缩方法和装置、图像分类方法和装置

    公开(公告)号:CN113657421A

    公开(公告)日:2021-11-16

    申请号:CN202110671327.1

    申请日:2021-06-17

    Inventor: 王培松 程健

    Abstract: 本发明提供一种卷积神经网络压缩方法和装置、图像分类方法和装置,其中卷积神经网络压缩方法包括:对预训练的卷积神经网络中的各个卷积操作层分别进行卷积核聚类,得到各个卷积操作层对应的卷积核类簇;对各个卷积操作层对应的每一卷积核类簇进行卷积核剪枝;对卷积核剪枝后的卷积神经网络进行重训练,得到压缩后的卷积神经网络。本发明实现了高效的卷积核剪枝,同时,上述方式不再受卷积核分布导致的剪枝敏感度不同的限制,从而极大的节省了卷积核剪枝的计算资源和时间资源的消耗。

    一种图像分类方法、存储装置和处理装置

    公开(公告)号:CN109325530B

    公开(公告)日:2021-05-04

    申请号:CN201811046300.8

    申请日:2018-09-07

    Inventor: 程健 贺翔宇

    Abstract: 本发明属于深度神经网络技术领域,具体涉及一种基于少量无标签数据的深度卷积神经网络的压缩方法,旨在解决在已有全精度网络模型基础上,对深度卷积神经网络所有层进行压缩,且不进行基于原始有标注训练数据进行再训练时,性能损失较大的问题,包括:获取原始深度卷积神经网络;对原始深度卷积神经网络中各层的权值张量进行稀疏化操作,得到多个含有较多0元素的权值张量;在已压缩的权值张量基础之上,通过少量无标注数据对压缩后的深度卷积神经网络中的批数据归一化层中的统计量进行更新,获得新的深度卷积神经网络。通过本发明实施例,实现了在仅依赖于少量无标注数据的大型深度卷积神经网络的压缩,降低了性能损失。

    卷积神经网络的分块卷积优化方法及装置

    公开(公告)号:CN107437110B

    公开(公告)日:2021-04-02

    申请号:CN201710560643.5

    申请日:2017-07-11

    Inventor: 程健 李钢 赵天理

    Abstract: 本发明涉及深度神经网络领域,提出了一种卷积神经网络的分块卷积优化方法及装置,旨在解决神经网络中卷积运算在硬件处理系统中的处理瓶颈问题,该优化方法包括:选择待分块卷积的卷积层,并确定其分块尺寸上限;根据分块尺寸的上限,确定输入特征图的分块数、分块尺寸;基于分块数、分块尺寸、卷积核尺寸、输入特征图尺寸、输入特征图边界填充尺寸,计算分块特征图的分块边界填充尺寸;基于分块数、分块尺寸、分块边界填充尺寸,构建基于分块边界填充的卷积,并替换原始卷积。本发明大大缓解了卷积神经网络在嵌入式硬件平台运行的资源受限问题,并在读写存储器时最大限度的提高突发长度,提高吞吐量,降低延时,提高效率。

Patent Agency Ranking