-
公开(公告)号:CN115104131A
公开(公告)日:2022-09-23
申请号:CN202080096681.X
申请日:2020-06-16
Applicant: 华为技术有限公司
Inventor: 兰旭 , 莎拉·帕里索 , 史蒂文·乔治·麦克唐纳 , 黄维然
IPC: G06V10/774 , G06V10/764 , G06V10/42 , G06V10/82 , G06N3/04 , G06N3/08
Abstract: 本发明描述了一种计算机系统(400)和方法(300),用于训练机器学习系统(200)以通过将输入数据分成多个类中的一个类来执行分类任务。所述系统用于:接收(301)每个类的训练数据(201),从所述训练数据(201)中可以推导出每个类的表示,其中,每个类由多个表示描述;处理(302)所述训练数据,以针对至少一个类形成用于训练数据项的相对全局部分的第一代理(204)和用于所述训练数据项的不同相对本地部分的多个代理(205),每个代理对应于属于该类的数据的表示。对于每个训练数据(201)项,所述系统用于:评估(303)所述训练数据项与所述代理之间的匹配;根据匹配等级估计(304)所述训练数据项的类;通过更新加权矩阵来调整(305)所述代理,以减小所述训练数据项和估计类的代理之间的距离。以这种方式定义多个代理可以使对象类的表示更丰富和更稳定。
-
公开(公告)号:CN115803752A
公开(公告)日:2023-03-14
申请号:CN202080102004.4
申请日:2020-09-08
Applicant: 华为技术有限公司
IPC: G06N3/0464 , G06N3/063
Abstract: 本文描述了一种用于机器学习的设备(900),所述设备(900)包括一个或多个处理器(901),所述处理器用于实现神经网络第一层、神经网络第二层以及布置在所述神经网络第一层与所述神经网络第二层之间的归一化层,所述归一化层用于在所述设备在对一批训练样本进行训练时执行以下操作:针对所述批次的多个训练样本接收(1001)所述神经网络第一层的多个输出,每个输出包括第一维度和第二维度上不同索引的多个数据值,所述第一维度表示通道维度;根据与所述输出相关的所述第一维度和所述第二维度上的所述索引,将所述输出分成(1002)多个组;为每个组形成(1003)归一化输出;提供(1004)所述归一化输出作为所述神经网络第二层的输入。这可以训练具有良好性能的深度卷积神经网络,所述深度卷积神经网络在不同批量大小时稳定运行并且可推广到多个视觉任务。这也可以加快所述训练并提高所述训练的性能。
-