文档可视结构的语法剖析

    公开(公告)号:CN101253514B

    公开(公告)日:2012-06-13

    申请号:CN200680031501.X

    申请日:2006-06-30

    Applicant: 微软公司

    CPC classification number: G06K9/726 G06F17/271 G06K2209/01

    Abstract: 利用文档的二维表示来提取有助于文档识别的分层结构。利用统计剖析算法的二维自适应来对该视觉结构进行语法剖析。这允许识别布局结构(例如,栏、作者、标题、脚注等-)等,使得文档的结构组成部分能被准确地解释。还可采用其它技术来帮助文档布局识别。例如,可采用利用机器学习、基于图像表示的剖析评分、上推技术和/或“快速特征”等的语法剖析技术来帮助文档识别。

    文档可视结构的语法剖析

    公开(公告)号:CN101253514A

    公开(公告)日:2008-08-27

    申请号:CN200680031501.X

    申请日:2006-06-30

    Applicant: 微软公司

    CPC classification number: G06K9/726 G06F17/271 G06K2209/01

    Abstract: 利用文档的二维表示来提取有助于文档识别的分层结构。利用统计剖析算法的二维自适应来对该视觉结构进行语法剖析。这允许识别布局结构(例如,栏、作者、标题、脚注等—)等,使得文档的结构组成部分能被准确地解释。还可采用其它技术来帮助文档布局识别。例如,可采用利用机器学习、基于图像表示的剖析评分、上推技术和/或“快速特征”等的语法剖析技术来帮助文档识别。

Patent Agency Ranking