-
公开(公告)号:CN117203629A
公开(公告)日:2023-12-08
申请号:CN202180094676.X
申请日:2021-04-12
Applicant: 微软技术许可有限责任公司
IPC: G06F18/24 , G06N3/042 , G06N3/0464 , G06N3/098
Abstract: 提供了用于学习分类器的系统和方法,该分类器用于在存在超过一百万个标签的极限分类下利用预测标签来注释文档。该学习包括接收包括作为节点的文档和标签的联合图。基于联合图的图卷积生成文档的多维向量表示(即,文档表示)。每个文档表示对相邻节点的依赖程度不同以容纳上下文。使用残差层对文档表示进行特征变换。基于相邻标签注意力从经变换的文档表示生成每标签文档表示。基于使用训练数据和每标签文档表示的联合学习,针对超过一百万个标签中的每个标签来训练分类器。与使用文档和标签的不相交图训练的其它分类器相比,经训练的分类器高度高效地执行。