-
公开(公告)号:CN1991837A
公开(公告)日:2007-07-04
申请号:CN200610164702.9
申请日:2006-11-14
Applicant: 国际商业机器公司
IPC: G06F17/30
CPC classification number: G06F17/2247 , G06F17/272
Abstract: 本发明的目标是提供一种能够使用诸如XML解析器之类的解析器来快速解析数字化的结构化文档的句法解析装置和方法。与实例文档和概要信息有关的统计信息被用于合并允许对结构化文档分段的多个状态转变,由此生成优化的自动机。在合并状态转变中,以ID列表的形式保存连续匹配状态转变,所述ID列表然后用于对连续状态转变数进行计数。此外,统计地获得包括嵌套元素的重复元素出现次数的模式。通过使用统计方法来解决XML中空白的变化。概要信息用于预先建立自动机,由此降低所述句法解析装置的初始开销。
-
公开(公告)号:CN1316828A
公开(公告)日:2001-10-10
申请号:CN01103241.3
申请日:2001-02-02
Applicant: 国际商业机器公司
CPC classification number: G06F17/30595 , H03M7/30 , Y10S707/99942
Abstract: 一种用于对数据编码和用于压缩编码数据的压缩设备包含:一个其中的数据是由标号树结构表示的树本机语言的语法规则12;一个用于读取以该树本机语言编写的文件,把文件划分成结构部分和内容,和用语法规则12对该结构部分编码的编码器11;一个用于压缩由编码器11提取的文件的内容,和对该压缩内容编码的压缩器13。
-