-
公开(公告)号:CN113139119A
公开(公告)日:2021-07-20
申请号:CN202010064971.8
申请日:2020-01-20
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F16/332
Abstract: 本公开涉及用于问题回答(QA)的对仗学习,并且提出了用于提供对仗训练数据的方法和装置。可以从训练数据集中获得一个正例,所述正例包括被标记为相关的第一文本和第二文本。可以从搜索日志中提取对仗信息。可以至少基于所述对仗信息来修改所述第一文本。可以将经修改的第一文本和所述第二文本组合成与所述正例对仗的反例,所述经修改的第一文本和所述第二文本在所述反例中被标记为不相关。
-
公开(公告)号:CN113127614A
公开(公告)日:2021-07-16
申请号:CN202010046175.1
申请日:2020-01-16
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06F16/335 , G06F16/9532 , G06F16/9535
Abstract: 本公开提供了用于基于隐式相关性反馈来提供QA训练数据以及训练QA模型的方法和装置。可以从搜索日志中获得问题‑文段对以及对应的用户行为。可以从所述用户行为中提取行为特征。可以通过隐式相关性反馈模型,基于所述行为特征来确定所述问题与所述文段之间的相关性分数。可以基于所述相关性分数,向所述问题‑文段对添加相关性标记。可以利用所获得的自动标记的QA训练数据来对QA模型进行预训练,并且利用人为标记的QA训练数据来对经预训练的QA模型进行精调。
-
公开(公告)号:CN115146654B
公开(公告)日:2025-05-06
申请号:CN202110338761.8
申请日:2021-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F40/58 , G06F40/284 , G06F40/211 , G06F18/214 , G06F18/2415
Abstract: 本公开提出了用于多模型联合去噪训练的方法和装置。可以获得多个模型。可以通过所述多个模型来对一组训练样本进行去噪。可以利用经去噪的一组训练样本来训练所述多个模型。
-
公开(公告)号:CN112257860B
公开(公告)日:2025-03-28
申请号:CN201910588384.6
申请日:2019-07-02
Applicant: 微软技术许可有限责任公司
IPC: G06N3/0495 , G06N3/045 , G06N3/088 , G06N3/096 , G06F16/3329 , G06N3/0442 , G06N3/048 , G06N5/04 , G06N20/20
Abstract: 本公开提供了一种用于模型生成的方法和装置。可以通过多个预训练模型对预训练数据集合进行评分,所述多个预训练模型执行第一任务。可以利用经评分的预训练数据集合来预训练初始模型。可以基于多个参考模型来更新所述初始模型,以获得目标模型,所述多个参考模型执行第二任务。可以通过所述多个参考模型对参考数据集合进行评分。可以利用经评分的参考数据集合来训练所述目标模型。
-
公开(公告)号:CN118733867A
公开(公告)日:2024-10-01
申请号:CN202310332238.3
申请日:2023-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F18/22
Abstract: 本公开提出了用于基于跨域行为数据的序列推荐的方法、装置和计算机可读介质。可以基于目标用户的历史内容项序列,生成所述目标用户的目标用户表示。可以从网络应用的日志中提取跨域行为序列集合。可以生成与所述跨域行为序列集合相对应的跨域序列表示集合。可以从所述跨域序列表示集合中检索与所述目标用户表示相似的相似序列表示集合。可以基于所述目标用户表示和所述相似序列表示集合,预测所述目标用户与候选内容项集合交互的交互概率集合。
-
公开(公告)号:CN118568379A
公开(公告)日:2024-08-30
申请号:CN202310212577.8
申请日:2023-02-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/958 , G06F16/904
Abstract: 本公开提出了用于提供标签页的活跃度指示的方法、装置和计算机可读介质。可以识别浏览器中的标签页。可以生成指示所述标签页的活跃度的活跃度指示器。可以在所述浏览器的用户界面中,与所述标签页相关联地呈现所述活跃度指示器。
-
公开(公告)号:CN116775814A
公开(公告)日:2023-09-19
申请号:CN202210207198.5
申请日:2022-03-04
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06N3/08 , G06N20/00
Abstract: 本公开提出了用于跨语言检索的句子表示生成的方法、装置和计算机程序产品。可以获得目标句子。可以通过编码器来生成所述目标句子的初始目标句子表示,所述编码器是通过对比上下文预测机制来预训练的。可以通过跨语言修正,基于所述初始目标句子表示,生成所述目标句子的目标句子表示以用于跨语言检索。
-
公开(公告)号:CN115146654A
公开(公告)日:2022-10-04
申请号:CN202110338761.8
申请日:2021-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F40/58 , G06F40/284 , G06F40/211 , G06K9/62
Abstract: 本公开提出了用于多模型联合去噪训练的方法和装置。可以获得多个模型。可以通过所述多个模型来对一组训练样本进行去噪。可以利用经去噪的一组训练样本来训练所述多个模型。
-
公开(公告)号:CN114254180A
公开(公告)日:2022-03-29
申请号:CN202011021589.5
申请日:2020-09-25
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9532 , G06F16/901 , G06F16/832 , G06F40/30
Abstract: 本公开提出了用于获得目标数据的表示的方法和装置。可以获得目标数据,所述目标数据至少包括半结构化数据。可以生成所述目标数据的初始数据表示。可以识别所述目标数据中的多个组分之间的关系。可以基于所述初始数据表示和所述关系来生成所述目标数据的数据表示。
-
公开(公告)号:CN112257860A
公开(公告)日:2021-01-22
申请号:CN201910588384.6
申请日:2019-07-02
Applicant: 微软技术许可有限责任公司
IPC: G06N3/08 , G06F16/332 , G06F16/35 , G06F40/295 , G06F40/20
Abstract: 本公开提供了一种用于模型生成的方法和装置。可以通过多个预训练模型对预训练数据集合进行评分,所述多个预训练模型执行第一任务。可以利用经评分的预训练数据集合来预训练初始模型。可以基于多个参考模型来更新所述初始模型,以获得目标模型,所述多个参考模型执行第二任务。可以通过所述多个参考模型对参考数据集合进行评分。可以利用经评分的参考数据集合来训练所述目标模型。
-
-
-
-
-
-
-
-
-