-
公开(公告)号:CN118733867A
公开(公告)日:2024-10-01
申请号:CN202310332238.3
申请日:2023-03-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9535 , G06F18/22
Abstract: 本公开提出了用于基于跨域行为数据的序列推荐的方法、装置和计算机可读介质。可以基于目标用户的历史内容项序列,生成所述目标用户的目标用户表示。可以从网络应用的日志中提取跨域行为序列集合。可以生成与所述跨域行为序列集合相对应的跨域序列表示集合。可以从所述跨域序列表示集合中检索与所述目标用户表示相似的相似序列表示集合。可以基于所述目标用户表示和所述相似序列表示集合,预测所述目标用户与候选内容项集合交互的交互概率集合。
-
公开(公告)号:CN116775814A
公开(公告)日:2023-09-19
申请号:CN202210207198.5
申请日:2022-03-04
Applicant: 微软技术许可有限责任公司
IPC: G06F16/332 , G06N3/08 , G06N20/00
Abstract: 本公开提出了用于跨语言检索的句子表示生成的方法、装置和计算机程序产品。可以获得目标句子。可以通过编码器来生成所述目标句子的初始目标句子表示,所述编码器是通过对比上下文预测机制来预训练的。可以通过跨语言修正,基于所述初始目标句子表示,生成所述目标句子的目标句子表示以用于跨语言检索。
-
公开(公告)号:CN118193671A
公开(公告)日:2024-06-14
申请号:CN202211607316.8
申请日:2022-12-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/33 , G06F16/36 , G06F18/214
Abstract: 本公开提出了用于多语言稠密检索的词典增强型自监督训练的方法、装置和计算机可读介质。可以利用源语言的训练数据集合,初步训练稠密检索器。可以通过词典增强型检索模块,生成目标语言的第一训练数据集合,所述词典增强型检索模块包括稀疏检索器和所述稠密检索器。可以至少利用所述目标语言的第一训练数据集合,训练所述稠密检索器。
-
公开(公告)号:CN116089839A
公开(公告)日:2023-05-09
申请号:CN202111269134.X
申请日:2021-10-29
Applicant: 微软技术许可有限责任公司
IPC: G06F18/22 , G06F18/23 , G06F18/214
Abstract: 本公开提供了用于确定目标实体的代表性事实的方法和装置。可以生成在与所述目标实体相关联的多个事实中的任意两个事实之间的相似度分数。可以利用所述多个事实中的事实之间的相似度分数来构建图,所述图中的每个节点对应于所述多个事实中的一个事实。可以通过提取所述图中的多个连通子图来获得多个事实聚类。可以从所述多个事实聚类中选择预定数量的代表性事实。
-
-
-