-
公开(公告)号:CN115114901B
公开(公告)日:2025-01-28
申请号:CN202110302025.7
申请日:2021-03-22
Applicant: 微软技术许可有限责任公司
IPC: G06F40/211 , G06F40/30 , G06F40/58 , G06N3/045 , G06N3/096
Abstract: 本公开提出了用于跨语言文本的表示学习的方法和装置。可以获得源语言文本和目标语言文本。可以生成所述源语言文本和所述目标语言文本的初始联合表示。可以识别所述源语言文本和所述目标语言文本中的多个词之间的关系。可以基于所述初始联合表示和所述关系来生成所述源语言文本和所述目标语言文本的联合表示。可以将所述联合表示至少映射为与所述目标语言文本相对应的目标语言表示。
-
公开(公告)号:CN111680193B
公开(公告)日:2024-05-14
申请号:CN202010469919.0
申请日:2020-05-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/901 , G06F16/9032
Abstract: 本公开提供了用于查询转换的方法和装置。可以获得用于第一图数据库的第一查询。可以通过对所述第一查询进行解析来生成语法树。可以基于所述语法树来创建查询图。可以将所述查询图转换成用于第二图数据库的第二查询。
-
公开(公告)号:CN116976340A
公开(公告)日:2023-10-31
申请号:CN202210434197.4
申请日:2022-04-24
Applicant: 微软技术许可有限责任公司
IPC: G06F40/295 , G06F40/20 , G06F40/117
Abstract: 本公开提供了用于建立适合于跨语言序列标记任务的语言模型的方法、装置、计算机程序产品和计算机可读介质。可以获得包括采用第一语言的第一语句和采用第二语言的第二语句的训练语句对,所述第二语句是所述第一语句在所述第二语言中的版本。可以利用至少一个预定义词条来屏蔽所述第一语句中的至少一个原始片段,以获得经屏蔽的第一语句。可以至少利用所述经屏蔽的第一语句和所述第二语句来形成所述语言模型的输入序列。可以通过所述语言模型生成所述输入序列的输入序列表示。可以至少基于所述输入序列表示来执行目标片段预测,以预测所述第二语句中的至少一个目标片段的起始位置和结束位置,所述至少一个目标片段分别对应于所述至少一个预定义词条。可以至少基于所述目标片段预测来优化所述语言模型。
-
公开(公告)号:CN116340645A
公开(公告)日:2023-06-27
申请号:CN202111587928.0
申请日:2021-12-23
Applicant: 微软技术许可有限责任公司
IPC: G06F16/9536 , G06F16/9535
Abstract: 本公开提出了用于基于图增强协同过滤的内容推荐的方法、装置和计算机程序产品。可以生成候选内容项的候选内容项表示。可以生成与目标用户的一组历史内容项相对应的一组历史内容项表示。可以基于一组元兴趣来生成针对全体用户的一组总体兴趣表示,每个元兴趣表征一个兴趣元素。可以基于所述一组历史内容项表示和所述一组总体兴趣表示来生成所述目标用户的用户兴趣表示。可以基于所述候选内容项表示和所述用户兴趣表示来预测所述目标用户点击所述候选内容项的点击概率。
-
公开(公告)号:CN115269944A
公开(公告)日:2022-11-01
申请号:CN202110478217.3
申请日:2021-04-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/904 , G06F16/903 , G06F40/18 , G06N3/04 , G06N3/08 , G06N20/10
Abstract: 本公开提出了用于基于查询的表格可视化的方法和装置。可以获得查询。可以获得针对所述查询的至少一个搜索结果。可以从所述至少一个搜索结果中提取表格。可以基于所述查询和所述表格来生成与所述表格相对应的至少一个图表。
-
公开(公告)号:CN115220875A
公开(公告)日:2022-10-21
申请号:CN202110404714.9
申请日:2021-04-15
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提出了用于执行多个任务的方法和装置。可以获得文本输入。可以生成所述文本输入的在多个层中的一组共享表示。可以基于所述一组共享表示来生成所述文本输入的多个任务特定表示。可以利用所述多个任务特定表示来分别执行所述多个任务。
-
公开(公告)号:CN118193671A
公开(公告)日:2024-06-14
申请号:CN202211607316.8
申请日:2022-12-14
Applicant: 微软技术许可有限责任公司
IPC: G06F16/33 , G06F16/36 , G06F18/214
Abstract: 本公开提出了用于多语言稠密检索的词典增强型自监督训练的方法、装置和计算机可读介质。可以利用源语言的训练数据集合,初步训练稠密检索器。可以通过词典增强型检索模块,生成目标语言的第一训练数据集合,所述词典增强型检索模块包括稀疏检索器和所述稠密检索器。可以至少利用所述目标语言的第一训练数据集合,训练所述稠密检索器。
-
公开(公告)号:CN117009498A
公开(公告)日:2023-11-07
申请号:CN202210469254.2
申请日:2022-04-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/34 , G06F16/338 , G06F40/103 , G06F40/18
Abstract: 本公开提出了用于基于智能条件格式的表格可视化的方法、装置和计算机程序产品。可以获得表格,所述表格包含多个域。可以生成所述多个域中的至少一个域的至少一个域表示。可以至少基于所述域表示来自动推荐与所述域相对应的条件格式。可以通过基于所述条件格式对所述域进行格式化来可视化所述表格。
-
公开(公告)号:CN116089839A
公开(公告)日:2023-05-09
申请号:CN202111269134.X
申请日:2021-10-29
Applicant: 微软技术许可有限责任公司
IPC: G06F18/22 , G06F18/23 , G06F18/214
Abstract: 本公开提供了用于确定目标实体的代表性事实的方法和装置。可以生成在与所述目标实体相关联的多个事实中的任意两个事实之间的相似度分数。可以利用所述多个事实中的事实之间的相似度分数来构建图,所述图中的每个节点对应于所述多个事实中的一个事实。可以通过提取所述图中的多个连通子图来获得多个事实聚类。可以从所述多个事实聚类中选择预定数量的代表性事实。
-
公开(公告)号:CN115599904A
公开(公告)日:2023-01-13
申请号:CN202110771263.2
申请日:2021-07-08
Applicant: 微软技术许可有限责任公司(US)
IPC: G06F16/335 , G06F16/9535 , G06F40/205
Abstract: 本公开提出了用于根据查询的问题生成的方法、装置和计算机程序产品。可以获得与搜索引擎相关联的搜索日志。可以从所述搜索日志中提取多个搜索查询和与所述多个搜索查询相对应的多个搜索结果集合。可以通过所述多个搜索查询和所述多个搜索结果集合来获得至少用于训练问题生成模型的训练数据集合,所述训练数据集合中的每个样本包括搜索查询和搜索结果的标题,所述标题是与所述搜索查询相对应的问题。
-
-
-
-
-
-
-
-
-