-
公开(公告)号:CN113780549A
公开(公告)日:2021-12-10
申请号:CN202110898412.1
申请日:2021-08-05
Applicant: 鹏城实验室
Abstract: 本申请公开了一种溢出感知的量化模型训练方法、装置、介质及终端设备,所述方法包括对预设网络模型中的网络层的目标数据进行量化处理,并基于量化处理后的目标数据以及网络层,确定网络层的输出数据,确定输出数据对应的溢出元素数量,并基于所述溢出元素数量调节所述网络层对应的量化缩放系数,以调节所述网络层对应的量化缩放因子。本实施例通过基于用于运行所述网络层的累加器的约束位数来对量化缩放系数及量化缩放因子进行调整,从而使得网络层的输出数据不会出现溢出的问题,进而可以提高模型性能,同时可以使得网络层在低约束位数的累加器中进行,从而可以增加用于运行网络层的累加器的并行数量,从而可以提高网络层的运算速度。
-
公开(公告)号:CN119830979A
公开(公告)日:2025-04-15
申请号:CN202510309307.8
申请日:2025-03-17
Applicant: 鹏城实验室
IPC: G06N3/08 , G06N3/063 , G06N3/048 , G06N3/0464
Abstract: 本申请实施例公开了一种模型数据处理方法、装置、计算机设备及存储介质。包括:获取预训练模型及预训练模型对应的模型数据,预训练模型为状态空间模型结构下的模型;根据模型数据确定预训练模型中需要进行数据处理加速的第一算子;对第一算子进行解耦处理,得到第一算子对应的第二算子,第二算子对应的硬件处理单元和第一算子对应的硬件处理单元不同;获取第二算子对应的待处理数据,并确定待处理数据对应的离散化参数;根据第二算子对待处理数据和离散化参数进行数据处理,得到数据处理结果。以此,通过模型的第一算子进行解耦出的第二算子可以被其他硬件处理单元加载,并对待处理数据进行离散化处理减少模型的计算量,提升了数据处理效率。
-
公开(公告)号:CN119851051A
公开(公告)日:2025-04-18
申请号:CN202510294247.7
申请日:2025-03-13
Applicant: 鹏城实验室
IPC: G06V10/77 , G06V10/82 , G06V10/42 , G06V10/44 , G06V10/764 , G06N3/0455 , G06N3/0464
Abstract: 本申请实施例提供一种数据处理方法、装置、存储介质及计算机设备,通过先获取批量图像的第一图像特征,输入视觉状态空间模型的当前处理模块,经四向扫描得初始全局感受野,再进行特征调整和维度变换,使中间变量最后维度为批量图像数量,结合当前处理模块的模型权重参数确定总输出特征。之后对总输出特征逆变换,再四向扫描整合得第二图像特征。当当前处理模块为最后一个时,基于第二图像特征确定图像分类结果。本方法通过合理维度变换,避免TPU因最后维度为1无法并行处理,充分发挥高性能TPU计算潜力,提高TPU使用率,有效提升数据处理效率。
-
-