-
公开(公告)号:CN105518667B
公开(公告)日:2019-06-18
申请号:CN201480047962.0
申请日:2014-06-30
Applicant: 微软技术许可有限责任公司
IPC: G06F16/951
CPC classification number: G06F16/2282 , G06F16/211 , G06F16/221 , G06F16/2455 , G06F16/284 , G06F16/901 , G06F16/951 , G06F16/955
Abstract: 用于理解供搜索的表格的方法、系统、和计算机程序产品。标识表格的主题列,使用其它表格检测列标题,并用知识检库检测列标题。可以在结构化数据搜索系统(SDSS)中利用方法,所述结构化数据搜索系统索引结构化信息,例如在关系型数据库中的表格或从网页提取的html表格。SDSS允许用户使用包括关键字搜索和数据查找数据的不同的机制在结构化信息(表格)上进行搜索。
-
公开(公告)号:CN109416705B
公开(公告)日:2023-06-30
申请号:CN201780040339.6
申请日:2017-06-22
Applicant: 微软技术许可有限责任公司
IPC: G06F40/205 , G06F16/332
Abstract: 本文中讨论的技术利用语料库的数据内的结构来解析非结构化数据以获取结构化数据和/或预测与非结构化数据和/或结构化数据相关的潜在数据。在一些示例中,可以以不同的粒度级别进行解析和/或预测。在一些示例中,可以迭代地进行解析和/或预测以提高准确度和/或暴露更多隐藏数据。
-
公开(公告)号:CN110140121A
公开(公告)日:2019-08-16
申请号:CN201780039079.0
申请日:2017-06-21
Applicant: 微软技术许可有限责任公司
IPC: G06F16/2458
Abstract: 处理单元可以确定数据集的第一子集,其包括基于数据记录的测量值选择的数据记录。该处理单元可以确定将断言映射到与断言相关联的数据记录的索引以及该记录的近似值。处理单元可以针对第一子集来处理查询以提供第一结果和第一精确度值,确定第一精度值不满足精确度标准,以及针对该索引来处理查询。在一些示例中,处理单元可以针对包括满足预定断言的数据记录的第二子集来处理查询。在一些示例中,处理单元可以接收数据记录并且确定第一子集。数据记录可以包括相应的测量值。具有较高测量值的数据记录可以比具有较低测量值的数据记录更频繁地出现在第一子集中。
-
公开(公告)号:CN105408890A
公开(公告)日:2016-03-16
申请号:CN201480040338.8
申请日:2014-07-14
Applicant: 微软技术许可有限责任公司
IPC: G06F17/24
Abstract: 本申请中描述的是与基于声音输入而针对列表数据执行操作有关的各种方法。ASR系统包括基于列表数据的内容而定制的语言模型。ASR系统接收表示用户语言的声音输入。ASR系统基于利用列表数据的内容而定制的ASR来创建声音信号的转录。基于声音信号的转录而执行针对列表数据的操作。
-
公开(公告)号:CN110140121B
公开(公告)日:2023-06-13
申请号:CN201780039079.0
申请日:2017-06-21
Applicant: 微软技术许可有限责任公司
IPC: G06F16/2458
Abstract: 处理单元可以确定数据集的第一子集,其包括基于数据记录的测量值选择的数据记录。该处理单元可以确定将断言映射到与断言相关联的数据记录的索引以及该记录的近似值。处理单元可以针对第一子集来处理查询以提供第一结果和第一精确度值,确定第一精度值不满足精确度标准,以及针对该索引来处理查询。在一些示例中,处理单元可以针对包括满足预定断言的数据记录的第二子集来处理查询。在一些示例中,处理单元可以接收数据记录并且确定第一子集。数据记录可以包括相应的测量值。具有较高测量值的数据记录可以比具有较低测量值的数据记录更频繁地出现在第一子集中。
-
公开(公告)号:CN105408890B
公开(公告)日:2021-07-13
申请号:CN201480040338.8
申请日:2014-07-14
Applicant: 微软技术许可有限责任公司
IPC: G06F40/18
Abstract: 本申请中描述的是与基于声音输入而针对列表数据执行操作有关的各种方法。ASR系统包括基于列表数据的内容而定制的语言模型。ASR系统接收表示用户语言的声音输入。ASR系统基于利用列表数据的内容而定制的ASR来创建声音信号的转录。基于声音信号的转录而执行针对列表数据的操作。
-
公开(公告)号:CN105518667A
公开(公告)日:2016-04-20
申请号:CN201480047962.0
申请日:2014-06-30
Applicant: 微软技术许可有限责任公司
CPC classification number: G06F16/2282 , G06F16/211 , G06F16/221 , G06F16/2455 , G06F16/284 , G06F16/901 , G06F16/951 , G06F16/955
Abstract: 用于理解供搜索的表格的方法、系统、和计算机程序产品。标识表格的主题列,使用其它表格检测列标题,并用知识检库检测列标题。可以在结构化数据搜索系统(SDSS)中利用方法,所述结构化数据搜索系统索引结构化信息,例如在关系型数据库中的表格或从网页提取的html表格。SDSS允许用户使用包括关键字搜索和数据查找数据的不同的机制在结构化信息(表格)上进行搜索。
-
公开(公告)号:CN108292310B
公开(公告)日:2022-05-24
申请号:CN201680064958.4
申请日:2016-11-02
Applicant: 微软技术许可有限责任公司
IPC: G06F40/146 , G06F40/279 , G06F16/36 , G06K9/62
Abstract: 使用数字实体相关来从组分图中生成复合知识图的技术。在一个方面,与主实体相关联的数字属性值可以被编码成基元,例如使用多分辨率编码方案来进行编码。可以基于从相关编码基元计算出的种子对来构建配对图,并且将配对图进一步扩展以包括种子对的主语和宾语以及连接到关系实体的对。针对每个候选对,计算相似度度量以确定是否存在匹配。相似度度量可以基于在与每个候选对直接或间接相关联的所有基元上对加权着陆概率求和。通过合并不仅来自候选对而且还来自候选对周围的对的基元匹配,可以整体实现有效实体匹配。
-
公开(公告)号:CN109416705A
公开(公告)日:2019-03-01
申请号:CN201780040339.6
申请日:2017-06-22
Applicant: 微软技术许可有限责任公司
IPC: G06F17/27 , G06F16/332
Abstract: 本文中讨论的技术利用语料库的数据内的结构来解析非结构化数据以获取结构化数据和/或预测与非结构化数据和/或结构化数据相关的潜在数据。在一些示例中,可以以不同的粒度级别进行解析和/或预测。在一些示例中,可以迭代地进行解析和/或预测以提高准确度和/或暴露更多隐藏数据。
-
公开(公告)号:CN108292310A
公开(公告)日:2018-07-17
申请号:CN201680064958.4
申请日:2016-11-02
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
CPC classification number: G06F17/30958
Abstract: 使用数字实体相关来从组分图中生成复合知识图的技术。在一个方面,与主实体相关联的数字属性值可以被编码成基元,例如使用多分辨率编码方案来进行编码。可以基于从相关编码基元计算出的种子对来构建配对图,并且将配对图进一步扩展以包括种子对的主语和宾语以及连接到关系实体的对。针对每个候选对,计算相似度度量以确定是否存在匹配。相似度度量可以基于在与每个候选对直接或间接相关联的所有基元上对加权着陆概率求和。通过合并不仅来自候选对而且还来自候选对周围的对的基元匹配,可以整体实现有效实体匹配。
-
-
-
-
-
-
-
-
-