-
公开(公告)号:CN115114901A
公开(公告)日:2022-09-27
申请号:CN202110302025.7
申请日:2021-03-22
Applicant: 微软技术许可有限责任公司
IPC: G06F40/211 , G06F40/30 , G06F40/58 , G06N3/04 , G06N3/08
Abstract: 本公开提出了用于跨语言文本的表示学习的方法和装置。可以获得源语言文本和目标语言文本。可以生成所述源语言文本和所述目标语言文本的初始联合表示。可以识别所述源语言文本和所述目标语言文本中的多个词之间的关系。可以基于所述初始联合表示和所述关系来生成所述源语言文本和所述目标语言文本的联合表示。可以将所述联合表示至少映射为与所述目标语言文本相对应的目标语言表示。
-
公开(公告)号:CN113822434A
公开(公告)日:2021-12-21
申请号:CN202010561319.7
申请日:2020-06-18
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于基于知识蒸馏来获得目标模型的方法和装置。可以获得数据集合和一组候选参考模型。可以针对所述数据集合中的每个训练样本,确定从所述一组候选参考模型中选择出的一组选定参考模型。可以获取所述一组选定参考模型针对所述训练样本输出的一组目标概率分布。可以利用所述一组目标概率分布来训练所述目标模型。
-
公开(公告)号:CN113139119A
公开(公告)日:2021-07-20
申请号:CN202010064971.8
申请日:2020-01-20
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F16/332
Abstract: 本公开涉及用于问题回答(QA)的对仗学习,并且提出了用于提供对仗训练数据的方法和装置。可以从训练数据集中获得一个正例,所述正例包括被标记为相关的第一文本和第二文本。可以从搜索日志中提取对仗信息。可以至少基于所述对仗信息来修改所述第一文本。可以将经修改的第一文本和所述第二文本组合成与所述正例对仗的反例,所述经修改的第一文本和所述第二文本在所述反例中被标记为不相关。
-
公开(公告)号:CN113127614A
公开(公告)日:2021-07-16
申请号:CN202010046175.1
申请日:2020-01-16
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/335 , G06F16/9532 , G06F16/9535
Abstract: 本公开提供了用于基于隐式相关性反馈来提供QA训练数据以及训练QA模型的方法和装置。可以从搜索日志中获得问题‑文段对以及对应的用户行为。可以从所述用户行为中提取行为特征。可以通过隐式相关性反馈模型,基于所述行为特征来确定所述问题与所述文段之间的相关性分数。可以基于所述相关性分数,向所述问题‑文段对添加相关性标记。可以利用所获得的自动标记的QA训练数据来对QA模型进行预训练,并且利用人为标记的QA训练数据来对经预训练的QA模型进行精调。
-
公开(公告)号:CN115146654B
公开(公告)日:2025-05-06
申请号:CN202110338761.8
申请日:2021-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F40/58 , G06F40/284 , G06F40/211 , G06F18/214 , G06F18/2415
Abstract: 本公开提出了用于多模型联合去噪训练的方法和装置。可以获得多个模型。可以通过所述多个模型来对一组训练样本进行去噪。可以利用经去噪的一组训练样本来训练所述多个模型。
-
公开(公告)号:CN112257860B
公开(公告)日:2025-03-28
申请号:CN201910588384.6
申请日:2019-07-02
Applicant: 微软技术许可有限责任公司
IPC: G06N3/0495 , G06N3/045 , G06N3/088 , G06N3/096 , G06F16/3329 , G06N3/0442 , G06N3/048 , G06N5/04 , G06N20/20
Abstract: 本公开提供了一种用于模型生成的方法和装置。可以通过多个预训练模型对预训练数据集合进行评分,所述多个预训练模型执行第一任务。可以利用经评分的预训练数据集合来预训练初始模型。可以基于多个参考模型来更新所述初始模型,以获得目标模型,所述多个参考模型执行第二任务。可以通过所述多个参考模型对参考数据集合进行评分。可以利用经评分的参考数据集合来训练所述目标模型。
-
公开(公告)号:CN118733867A
公开(公告)日:2024-10-01
申请号:CN202310332238.3
申请日:2023-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F18/22
Abstract: 本公开提出了用于基于跨域行为数据的序列推荐的方法、装置和计算机可读介质。可以基于目标用户的历史内容项序列,生成所述目标用户的目标用户表示。可以从网络应用的日志中提取跨域行为序列集合。可以生成与所述跨域行为序列集合相对应的跨域序列表示集合。可以从所述跨域序列表示集合中检索与所述目标用户表示相似的相似序列表示集合。可以基于所述目标用户表示和所述相似序列表示集合,预测所述目标用户与候选内容项集合交互的交互概率集合。
-
公开(公告)号:CN118484588A
公开(公告)日:2024-08-13
申请号:CN202310153940.3
申请日:2023-02-13
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06N3/02 , G06N20/00 , H04L67/55
Abstract: 本公开提出了用于基于鲁棒特征网络的个性化多语言内容推荐的方法、装置和计算机可读介质。可以获得候选内容项的标题和初始特征集合。可以基于所述标题和所述初始特征集合,生成所述候选内容项的候选内容项表征。可以基于目标用户的一组历史内容项,生成所述目标用户的用户表征。可以预测所述候选内容项表征与所述用户表征之间的相似度。
-
公开(公告)号:CN116775814A
公开(公告)日:2023-09-19
申请号:CN202210207198.5
申请日:2022-03-04
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06N3/08 , G06N20/00
Abstract: 本公开提出了用于跨语言检索的句子表示生成的方法、装置和计算机程序产品。可以获得目标句子。可以通过编码器来生成所述目标句子的初始目标句子表示,所述编码器是通过对比上下文预测机制来预训练的。可以通过跨语言修正,基于所述初始目标句子表示,生成所述目标句子的目标句子表示以用于跨语言检索。
-
公开(公告)号:CN116484126A
公开(公告)日:2023-07-25
申请号:CN202210040984.0
申请日:2022-01-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/957 , G06F16/958
Abstract: 本公开提供了用于网页中的列表提取和可视化的方法、装置和计算机程序产品。可以检测目标网页中的至少一个锚点元素组,所述至少一个锚点元素组包括第一锚点元素组。可以对所述第一锚点元素组中的多个锚点元素执行边界检测,以获得与所述多个锚点元素分别关联的多个项目的边界,所述多个项目对应于所述目标网页中的第一原始列表。可以利用所述多个项目的边界,从所述目标网页中获得与所述多个项目分别对应的多组代表性元数据。可以将所述多组代表性元数据可视化为结构化列表。
-
-
-
-
-
-
-
-
-