-
公开(公告)号:CN116635874B
公开(公告)日:2025-04-04
申请号:CN202080107781.8
申请日:2020-12-25
Applicant: 微软技术许可有限责任公司
Abstract: 提供了用于基于训练数据训练数据模型的系统和方法。该训练包括基于自回归(AR)模型和非自回归(NAR)模型的组合预训练和微调数据模型。训练数据可以被并被编码为词元流。解码期间的预训练器生成AR和NAR组合的模型的连续数据结构的连续统一体,AR和NAR组合的模型包括主流和一系列预测流。预测流中的掩码词元参考或注意主流或先前预测流中的一个或多个先前词元。微调器根据目标数据模型选择流来生成经训练的模型。目标数据模型基于平衡用于预测词元的准确性约束和效率约束被确定。解码器在生成经训练的数据模型中充当AR和NAR模型之间的桥梁。
-
公开(公告)号:CN117203629A
公开(公告)日:2023-12-08
申请号:CN202180094676.X
申请日:2021-04-12
Applicant: 微软技术许可有限责任公司
IPC: G06F18/24 , G06N3/042 , G06N3/0464 , G06N3/098
Abstract: 提供了用于学习分类器的系统和方法,该分类器用于在存在超过一百万个标签的极限分类下利用预测标签来注释文档。该学习包括接收包括作为节点的文档和标签的联合图。基于联合图的图卷积生成文档的多维向量表示(即,文档表示)。每个文档表示对相邻节点的依赖程度不同以容纳上下文。使用残差层对文档表示进行特征变换。基于相邻标签注意力从经变换的文档表示生成每标签文档表示。基于使用训练数据和每标签文档表示的联合学习,针对超过一百万个标签中的每个标签来训练分类器。与使用文档和标签的不相交图训练的其它分类器相比,经训练的分类器高度高效地执行。
-
公开(公告)号:CN116490864A
公开(公告)日:2023-07-25
申请号:CN202080106212.1
申请日:2020-10-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/24
Abstract: 提供了用于从输入查询生成关键字序列的系统和方法。可以接收对应于输入查询的第一文本序列,并且使用机器学习模型的编码器将第一文本序列编码为源序列表示。然后可以使用机器学习模型的解码器从源序列表示生成关键字语句。解码器可以为多个预测令牌生成经修改的生成得分,其中经修改的生成得分基于相应预测令牌生成得分和每个预测令牌的后缀的最大生成得分。解码器然后可以基于经修改的生成得分来选择多个预测令牌中的预测令牌,并且将选择的预测令牌添加到由解码器提供的先前解码的部分假设。
-
公开(公告)号:CN108604313B
公开(公告)日:2022-09-13
申请号:CN201780010748.1
申请日:2017-02-06
Applicant: 微软技术许可有限责任公司
Abstract: 提供了预测性框架的系统和方法。该预测性框架包括可适应的、可执行的神经元的多个神经层。神经元接受一个或多个输入信号,并产生可以由上层神经层使用的输出信号。输入信号由编码神经层接收,在编码神经层中,输入信号和编码神经元之间存在1:1的对应关系。输入信号在编码层处被接收,并由各种神经层连续处理。目标函数利用最顶层神经层的输出信号,根据目标来生成针对数据集的预测性结果。在一个实施例中,目标是:确定用户关于搜索结果集中的特定内容项的交互的可能性,或者确定用户关于搜索结果集中的任何内容项的交互的可能性。
-
公开(公告)号:CN108604313A
公开(公告)日:2018-09-28
申请号:CN201780010748.1
申请日:2017-02-06
Applicant: 微软技术许可有限责任公司
Abstract: 提供了预测性框架的系统和方法。该预测性框架包括可适应的、可执行的神经元的多个神经层。神经元接受一个或多个输入信号,并产生可以由上层神经层使用的输出信号。输入信号由编码神经层接收,在编码神经层中,输入信号和编码神经元之间存在1:1的对应关系。输入信号在编码层处被接收,并由各种神经层连续处理。目标函数利用最顶层神经层的输出信号,根据目标来生成针对数据集的预测性结果。在一个实施例中,目标是:确定用户关于搜索结果集中的特定内容项的交互的可能性,或者确定用户关于搜索结果集中的任何内容项的交互的可能性。
-
公开(公告)号:CN116635874A
公开(公告)日:2023-08-22
申请号:CN202080107781.8
申请日:2020-12-25
Applicant: 微软技术许可有限责任公司
IPC: G06N20/00
Abstract: 提供了用于基于训练数据训练数据模型的系统和方法。该训练包括基于自回归(AR)模型和非自回归(NAR)模型的组合预训练和微调数据模型。训练数据可以被并被编码为词元流。解码期间的预训练器生成AR和NAR组合的模型的连续数据结构的连续统一体,AR和NAR组合的模型包括主流和一系列预测流。预测流中的掩码词元参考或注意主流或先前预测流中的一个或多个先前词元。微调器根据目标数据模型选择流来生成经训练的模型。目标数据模型基于平衡用于预测词元的准确性约束和效率约束被确定。解码器在生成经训练的数据模型中充当AR和NAR模型之间的桥梁。
-
公开(公告)号:CN116438529A
公开(公告)日:2023-07-14
申请号:CN202080107084.2
申请日:2020-11-12
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9032
Abstract: 一种用于生成式常识推理的知识注入模型。在示例中,使用编码器‑解码器模型来生成模型输出(204),针对概念集的合理描述。从领域内或领域外知识语料库生成原型(218),该原型进一步被用作针对编码器‑解码器模型的输入(202)。缩放概念输入令牌和原型输入令牌,以限制可能由原型(218)引入的潜在偏差。另外,针对每个输入令牌生成位置指示符,这些位置指示符指示每个输入令牌与其他输入令牌相比的相对位置。如此,在对经缩放的、经编码的输入令牌进行解码时,解码器(214)可以更适应由原型(218)在生成模型输出(204)时引入的场景偏差。因此,在生成模型输出(204)时,编码器‑解码器模型不需要仅仅依赖于概念集。
-
-
-
-
-
-