-
公开(公告)号:CN114091430A
公开(公告)日:2022-02-25
申请号:CN202010609575.9
申请日:2020-06-29
Applicant: 微软技术许可有限责任公司
IPC: G06F40/211 , G06F40/289 , G06F40/30
Abstract: 根据本公开的实现,提供了一种基于子句的语义解析方案。在该方案中,从目标语句中确定具有独立语义的第一子句。基于与第一子句的语义对应的第一逻辑表示,目标语句被转换为第一中间语句。随后,确定与第一中间语句的至少部分语义对应的至少一个逻辑表示。以上获得的第一逻辑表示和该至少一个逻辑表示可以用于确定与目标语句的语义对应的目标逻辑表示。由此,可以实现更为准确的语义解析。
-
公开(公告)号:CN112580357A
公开(公告)日:2021-03-30
申请号:CN201910930771.3
申请日:2019-09-29
Applicant: 微软技术许可有限责任公司
IPC: G06F40/30 , G06F40/151 , G06F16/33
Abstract: 根据本公开的实现,提出了一种用于自然语言查询的语义解析的方案。在该方案中,针对数据表的自然语言查询被接收,其中自然语言查询包括多个词。与数据表相关联的一组知识表示被获取,该组知识表示以结构化方式描述理解针对数据表的自然语言查询所需的知识。通过基于该组知识表示将多个词替换成预定符号表中的相应符号,将自然语言查询转换成符号序列。与自然语言查询相对应的计算机可执行查询基于该符号序列被生成。本方案能够将来自不同领域的各种知识表示成通用的结构化知识表示,从而使用这些知识表示来帮助理解自然语言查询的语义并且生成对应的计算机可执行查询。
-
-
公开(公告)号:CN110659527A
公开(公告)日:2020-01-07
申请号:CN201810698750.9
申请日:2018-06-29
Applicant: 微软技术许可有限责任公司
IPC: G06F40/177 , G06F40/18
Abstract: 本公开涉及电子表单中的表格检测。根据本公开的实现,提出了一种用于确定电子表单中的表格的方案。在该方案中,可以提取电子表单中包括的多个单元格各自的多个属性。继而,可以基于提取的多个属性,确定多个单元格各自的特征。基于特征,可以将多个单元格划分为至少一个候选区域。基于至少一个候选区域,可以确定电子表单中的至少一个候选表格。通过该方案,可以基于电子表单中包括的多个单元格各自的属性来确定各个单元格的特征,进而可以基于针对各个单元格的特征来确定其中可能存在表格的候选区域。
-
公开(公告)号:CN106462399B
公开(公告)日:2019-10-18
申请号:CN201480079895.0
申请日:2014-06-30
Applicant: 微软技术许可有限责任公司
Abstract: 方法大体涉及代码推荐。在该方法中,代码片断(2201,2202,…220n)可以使用以调用为中心的代码切分过程来提取并且之后根据方法用途来分组。针对每个方法用途,代表性代码片断可以被选择并且与元数据(2301,2302,…230n)相关联地被存储在知识库(210)中。编程上下文可以被获得并且被用于查询知识库(210)以检索用于推荐的一个或多个代码片断。所推荐的代码片断可以被排名以改进效用和用户友好性,并且元数据(2301,2302,…230n)可以被用于提供变化点以及可能的其他辅助信息,以改进操作效率和用户体验。
-
公开(公告)号:CN106255965A
公开(公告)日:2016-12-21
申请号:CN201480074451.8
申请日:2014-01-30
Applicant: 微软技术许可有限责任公司
IPC: G06F17/30
Abstract: 提供了自动地识别来自数据集的见解并且按照重要性排名图形地及以自然语言文本呈现见解。在数据集中的不同数据类型和结构自动被辨识并且与对应的特定分析类型匹配。数据根据确定的对应分析类型而被分析,并且来自该分析的见解被自动地识别。在给定见解类型中的和见解类型之间的见解以重要性顺序在自动生成的图表中以及自然语言文本中被排名及呈现,该自动生成的图表形象化描述每个见解,该自然语言文本以不熟悉统计学的普通观众可理解的方式描述每个见解。
-
公开(公告)号:CN112036394B
公开(公告)日:2024-12-24
申请号:CN202010868389.7
申请日:2020-08-26
Applicant: 微软技术许可有限责任公司
IPC: G06F18/22 , G06F16/9535 , G06N3/0464 , G06V30/14 , G06V30/18 , G06V30/19 , G06V10/82
Abstract: 本公开提供了用于检测与数据收集相关的内容的正当性的方法和装置。可以获得与数据收集相关的内容。可以从所述内容中检测至少一个标识性元素。可以识别与所述标识性元素相对应的实体。可以至少基于所述内容的创建者与所述实体之间的相关性来确定所述内容的正当性。
-
公开(公告)号:CN116547686A
公开(公告)日:2023-08-04
申请号:CN202180079293.5
申请日:2021-07-30
Applicant: 微软技术许可有限责任公司
IPC: G06Q30/06
Abstract: 本公开提供了用于创建用于检测数据收集正当性的目标模型的方法和装置。可以对训练数据集中的原始特征执行特征变换以获得经变换特征。可以对所述经变换特征执行特征选择以获得所选择的特征。可以通过至少对所选择的特征中的多组数值特征分别施加约束策略,来利用所选择的特征对所述目标模型进行建模。可以通过至少对所述多组数值特征分别执行平滑来训练所述目标模型。
-
公开(公告)号:CN115526177A
公开(公告)日:2022-12-27
申请号:CN202110711428.7
申请日:2021-06-25
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提供了对象关联模型的训练的方案。根据该方案,获取目标语义对象和自然语言的第一文本序列,该第一文本序列包括多个文本单元。确定目标语义对象在第一文本序列中被提及的第一置信度得分。确定在第一文本序列中的第一文本单元被忽略的情况下目标语义对象在第一文本序列中被提及的第二置信度得分;以及至少基于第一置信度得分与第二置信度得分之间的第一置信度差异、第一文本序列和目标语义对象来训练对象关联模型。对象关联模型被配置为确定目标语义对象是否与多个文本单元之一相关联。由此,可以减少标注训练数据集的成本和难度,并且提高标注准确度和效率。
-
公开(公告)号:CN113468589A
公开(公告)日:2021-10-01
申请号:CN202010237495.5
申请日:2020-03-30
Applicant: 微软技术许可有限责任公司
Abstract: 本公开提供了用于检测数据收集正当性的方法和装置。所述数据收集可以是通过用户在数据收集服务中处理与所述数据收集相关的内容来实施的。可以监视在所述数据收集服务和/或至少一个外部服务中发生的至少一个事件,所述事件与所述内容和/或所述用户相关联。可以响应于所述事件,从所述数据收集服务和/或所述外部服务中检测与所述事件相关联的状态信息。可以基于所述状态信息来确定内容评价等级和/或创建者评价等级,所述内容评价等级对应于所述内容的正当性,所述创建者评价等级对应于所述内容的创建者的正当性。
-
-
-
-
-
-
-
-
-