-
公开(公告)号:CN114286998A
公开(公告)日:2022-04-05
申请号:CN202080060469.8
申请日:2020-06-12
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9532 , G06F16/9535 , G06F16/9537 , G06F16/9538 , G06F16/33 , G06F16/332 , G06F40/30
Abstract: 描述了个性化用户的快速回答的机制。查询历史由用户先前提交的查询组成。查询历史中的每个条目包括查询、相关联的快速回答,以及与提交查询的用户相关联的用户ID。通过将查询历史中的每个查询条目的查询提交给经训练机器学习分类器以利用相关联的快速回答段对查询进行分类,查询数据库被创建。快速回答段与查询历史中的其他信息组合,以将条目创建到查询数据库中。当来自用户的当前查询被接收到时,查询数据库被搜索并且来自相同用户的具有相同快速回答段的先前查询被提取。所得查询的子集与来自其他用户的查询的子集被组合,以个性化搜索结果。
-
公开(公告)号:CN114127702A
公开(公告)日:2022-03-01
申请号:CN202080051390.9
申请日:2020-06-09
Applicant: 微软技术许可有限责任公司
IPC: G06F15/177 , G06F15/163
Abstract: 本文中所描述的方法、系统、装置和计算机程序产品支持大型AI模型在被通信地连接到参数服务器的存储器受限目标设备上的执行,该参数服务器存储AI模型的主副本。AI模型可以被分解成较小的部分(例如,层或子层),并且每个部分可以在目标设备上尽可能高效地执行。在AI模型的一部分的执行完成之后,可以在目标设备处下载并执行AI模型的另一部分。为了提高效率,可以将输入样本划分为微批次,并且按顺序执行的多个微批次可以形成迷你批次。可以手动或自动地调节一组微批次或迷你批次的大小以减少通信开销。
-