-
公开(公告)号:CN116702858A
公开(公告)日:2023-09-05
申请号:CN202310514419.8
申请日:2023-05-08
Applicant: 华为技术有限公司
IPC: G06N3/082 , G06N3/0464 , G06N3/08
Abstract: 本申请涉及计算机技术领域,公开了一种模型处理方法、电子设备及介质,模型处理方法包括对训练得到的收敛模型进行权重剪枝得到剪枝模型后,对被剪枝权重中部分影响模型精度的重要权重进行恢复,并将恢复后的重要权重应用到剪枝模型中,以进行模型的再次训练,直至获得收敛后的模型。如此,可以使得在实现压缩模型的同时,实现保证模型的精度。
-
公开(公告)号:CN116401552A
公开(公告)日:2023-07-07
申请号:CN202310444662.7
申请日:2023-04-14
Applicant: 华为技术有限公司
IPC: G06F18/214 , G06F18/24 , G06F18/25 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/048 , G06N3/084
Abstract: 一种分类模型的训练方法,应用于人工智能技术领域。在该方法中,先基于原始训练数据,生成数据量更小的目标训练数据,以得到不同尺度的训练数据,确保训练数据的尺度多样性;并且,考虑到AI生成数据的特点,对于数据量较小且原始是由AI生成的目标训练数据,将这部分目标训练数据标记为无标签数据,进而使得分类模型在训练时能够聚焦于AI生成的与人工生成不同的数据,避免将其标记为AI生成数据时影响分类模型对AI生成数据风格的感知,有效提高了分类模型的预测准确率。
-