-
公开(公告)号:CN107771334A
公开(公告)日:2018-03-06
申请号:CN201680034233.0
申请日:2016-06-06
Applicant: 微软技术许可有限责任公司
Inventor: P·A·贝恩斯泰因 , 何业烨 , E·科特兹卡斯托迪奥维拉林霍 , L·诺维克
CPC classification number: G06F17/3053 , G06F17/241 , G06F17/246 , G06F17/30286 , G06F17/30525
Abstract: 通过使用源对目标列执行自动注释来改进对目标数据库的目标列的注释的技术和构造。这些技术包括计算在目标列与从在源中所包括的表格提取的列之间的相似度得分。相似度得分至少部分基于在目标数据库的目标列中的值与从表格中提取的列的列值之间的相似度以及在目标数据库的目标列的身份与从表格中提取的列的列身份之间的相似度来计算。在一些示例中,这些技术计算一个或多个所提取列的相似度得分,并且基于相似度得分来注释目标列。
-
公开(公告)号:CN107771334B
公开(公告)日:2021-08-06
申请号:CN201680034233.0
申请日:2016-06-06
Applicant: 微软技术许可有限责任公司
Inventor: P·A·贝恩斯泰因 , 何业烨 , E·科特兹卡斯托迪奥维拉林霍 , L·诺维克
IPC: G06F16/2457 , G06F40/18 , G06F40/169 , G06F16/20
Abstract: 通过使用源对目标列执行自动注释来改进对目标数据库的目标列的注释的技术和构造。这些技术包括计算在目标列与从在源中所包括的表格提取的列之间的相似度得分。相似度得分至少部分基于在目标数据库的目标列中的值与从表格中提取的列的列值之间的相似度以及在目标数据库的目标列的身份与从表格中提取的列的列身份之间的相似度来计算。在一些示例中,这些技术计算一个或多个所提取列的相似度得分,并且基于相似度得分来注释目标列。
-