-
公开(公告)号:CN111428457A
公开(公告)日:2020-07-17
申请号:CN201811575065.3
申请日:2018-12-21
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于数据表的自动格式化的方案。一种计算机实现的方法包括获取数据表的多个单元格的至少一个属性的取值,至少一个属性的取值指示多个单元格中填充的数据的语义和数据表的结构中的至少一项,多个单元格以行和列布置在数据表中;利用第一学习网络,提取至少一个属性的取值的特征表示;以及至少利用第一学习网络,基于特征表示确定多个单元格各自的格式。以此方式,利用学习网络实现从单元格的属性设置到单元格格式之间的自动映射,以实现数据表的自动格式化。
-
公开(公告)号:CN114207598A
公开(公告)日:2022-03-18
申请号:CN201980099111.3
申请日:2019-08-08
Applicant: 微软技术许可有限责任公司
Inventor: 董浩宇 , 韩石 , 张冬梅 , J·M·哈尔贝斯塔姆 , 吕潇
IPC: G06F16/22
Abstract: 提供了一种用于电子表单表转换的方案。在该方案中,检测电子表单表的至少一个表头区域和数据区域。通过分析表头区域中的单元合并和/或缩进、和/或数据区域的对应单元中的数据项之间的函数关系,确定表头区域中每个表头区域的层级结构。基于对表头区域的层级结构的识别,电子表单表能够被转换为关系表。以此方式,基于表头层级来辅助理解表头结构,可以实现从电子表单表向关系表的自动转换。
-
公开(公告)号:CN111428457B
公开(公告)日:2024-03-22
申请号:CN201811575065.3
申请日:2018-12-21
Applicant: 微软技术许可有限责任公司
Abstract: 根据本公开的实现,提出了一种用于数据表的自动格式化的方案。一种计算机实现的方法包括获取数据表的多个单元格的至少一个属性的取值,至少一个属性的取值指示多个单元格中填充的数据的语义和数据表的结构中的至少一项,多个单元格以行和列布置在数据表中;利用第一学习网络,提取至少一个属性的取值的特征表示;以及至少利用第一学习网络,基于特征表示确定多个单元格各自的格式。以此方式,利用学习网络实现从单元格的属性设置到单元格格式之间的自动映射,以实现数据表的自动格式化。
-
公开(公告)号:CN114207598B
公开(公告)日:2025-05-02
申请号:CN201980099111.3
申请日:2019-08-08
Applicant: 微软技术许可有限责任公司
Inventor: 董浩宇 , 韩石 , 张冬梅 , J·M·哈尔贝斯塔姆 , 吕潇
IPC: G06F16/22
Abstract: 提供了一种用于电子表单表转换的方案。在该方案中,检测电子表单表的至少一个表头区域和数据区域。通过分析表头区域中的单元合并和/或缩进、和/或数据区域的对应单元中的数据项之间的函数关系,确定表头区域中每个表头区域的层级结构。基于对表头区域的层级结构的识别,电子表单表能够被转换为关系表。以此方式,基于表头层级来辅助理解表头结构,可以实现从电子表单表向关系表的自动转换。
-
公开(公告)号:CN110659527B
公开(公告)日:2023-03-28
申请号:CN201810698750.9
申请日:2018-06-29
Applicant: 微软技术许可有限责任公司
IPC: G06F40/177 , G06F40/18
Abstract: 本公开涉及电子表单中的表格检测。根据本公开的实现,提出了一种用于确定电子表单中的表格的方案。在该方案中,可以提取电子表单中包括的多个单元格各自的多个属性。继而,可以基于提取的多个属性,确定多个单元格各自的特征。基于特征,可以将多个单元格划分为至少一个候选区域。基于至少一个候选区域,可以确定电子表单中的至少一个候选表格。通过该方案,可以基于电子表单中包括的多个单元格各自的属性来确定各个单元格的特征,进而可以基于针对各个单元格的特征来确定其中可能存在表格的候选区域。
-
公开(公告)号:CN110659527A
公开(公告)日:2020-01-07
申请号:CN201810698750.9
申请日:2018-06-29
Applicant: 微软技术许可有限责任公司
IPC: G06F40/177 , G06F40/18
Abstract: 本公开涉及电子表单中的表格检测。根据本公开的实现,提出了一种用于确定电子表单中的表格的方案。在该方案中,可以提取电子表单中包括的多个单元格各自的多个属性。继而,可以基于提取的多个属性,确定多个单元格各自的特征。基于特征,可以将多个单元格划分为至少一个候选区域。基于至少一个候选区域,可以确定电子表单中的至少一个候选表格。通过该方案,可以基于电子表单中包括的多个单元格各自的属性来确定各个单元格的特征,进而可以基于针对各个单元格的特征来确定其中可能存在表格的候选区域。
-
-
-
-
-