-
公开(公告)号:CN1512407A
公开(公告)日:2004-07-14
申请号:CN02160023.6
申请日:2002-12-30
Applicant: 佳能株式会社
Abstract: 本发明公开了一种用于中文电子词典的数据结构形成方法、具有带有由该方法形成的数据结构的存储器的中文电子词典以及用于该电子词典的多数组结构。该数据结构包括由n+1个数组形成的多数组结构,其中第一到第n数组用于保存中文词典中的中文词的第一到第n中文字符。第n+1数组用于保存所有中文词的编码和压缩词条信息。利用这样的中文电子词典,能极大降低中文词典占据的存储器空间,并且提高中文词的查找速度。
-
公开(公告)号:CN1641640A
公开(公告)日:2005-07-20
申请号:CN200410001915.0
申请日:2004-01-15
Applicant: 佳能株式会社
Inventor: 杨大为
IPC: G06F17/30
Abstract: 一种用于电子词典中多个专业词典的数据结构的合并方法及装置,每一数据结构包括一个由n+1层数组组成的多数组结构,第一至第n层数组分别存放专业词典中所有词的第一至第n字符及其索引消息,第n+1层数组存放专业词典中所有词的词条信息,第二至第n层数组分别划分成包括一个或多个结构的多个区,该结构由字符部分和带有对应于下一数组中的位置的起始索引值的索引部分组成,所述方法包括:加载与第一和第二词典的文件分别相对应的第一和第二数据结构;将第二数据结构中第一层数组外的所有数组与第一数据结构中相同层的数组连接;将第二数据结构中第一层数组的元素所引导的树与第一数据结构中相应的树合并,从而形成第一和第二词典的文件的合并数据结构。
-
公开(公告)号:CN1512308A
公开(公告)日:2004-07-14
申请号:CN02159546.1
申请日:2002-12-27
Applicant: 佳能株式会社
IPC: G06F3/023
Abstract: 本发明公开了一种汉字拼音的处理方法、装置以及存储介质。该方法包括,输入步骤,用于输入文件中每个汉字的拼音;计算步骤,用于计算每个韵母和每个声母与声调的组合的出现概率;以及编码步骤,用于根据每个韵母以及每个声母与声调的组合的出现概率,对文件中每个汉字的拼音进行编码。本方法也可基于每个声母和每个韵母与声调的组合的出现概率,对汉字拼音进行处理。根据本发明,可以得到一种可靠的和快速的处理汉字拼音的方法。拼音的压缩率能够得到极大地改善,需要较少的空间存储文件中的拼音。
-
公开(公告)号:CN100410852C
公开(公告)日:2008-08-13
申请号:CN02159546.1
申请日:2002-12-27
Applicant: 佳能株式会社
IPC: G06F3/023
Abstract: 本发明公开了一种汉字拼音的处理方法、装置以及存储介质。该方法包括,输入步骤,用于输入文件中每个汉字的拼音;计算步骤,用于计算每个韵母和每个声母与声调的组合的出现概率;以及编码步骤,用于根据每个韵母以及每个声母与声调的组合的出现概率,对文件中每个汉字的拼音进行编码。本方法也可基于每个声母和每个韵母与声调的组合的出现概率,对汉字拼音进行处理。根据本发明,可以得到一种可靠的和快速的处理汉字拼音的方法。拼音的压缩率能够得到极大地改善,需要较少的空间存储文件中的拼音。
-
公开(公告)号:CN100389418C
公开(公告)日:2008-05-21
申请号:CN200410001915.0
申请日:2004-01-15
Applicant: 佳能株式会社
Inventor: 杨大为
IPC: G06F17/30
Abstract: 一种用于电子词典中多个专业词典的数据结构的合并方法及装置,每一数据结构包括一个由n+1层数组组成的多数组结构,第一至第n层数组分别存放专业词典中所有词的第一至第n字符及其索引消息,第n+1层数组存放专业词典中所有词的词条信息,第二至第n层数组分别划分成包括一个或多个结构的多个区,该结构由字符部分和带有对应于下一数组中的位置的起始索引值的索引部分组成,所述方法包括:加载与第一和第二词典的文件分别相对应的第一和第二数据结构;将第二数据结构中第一层数组外的所有数组与第一数据结构中相同层的数组连接;将第二数据结构中第一层数组的元素所引导的树与第一数据结构中相应的树合并,从而形成第一和第二词典的文件的合并数据结构。
-
公开(公告)号:CN1614584A
公开(公告)日:2005-05-11
申请号:CN200310114889.8
申请日:2003-11-07
Applicant: 佳能株式会社
Abstract: 本发明公开一种用于存储有词组的辅助拼音信息的中文电子词典的数据结构形成方法、以及一种包括存储有所形成的数据结构的存储器的中文电子词典,以有效地存储拼音信息和改善存储空间效率。本发明还公开一种在存储有词组的辅助拼音信息的中文电子词典中用于确定中文词组拼音的方法,以改善存储空间效率。所述在中文电子词典中用于词组的拼音信息的数据结构形成方法包括步骤:确定每一个中文字符的默认拼音;为具有多个拼音的中文字符创建非默认拼音表;以及形成辅助拼音信息,该辅助拼音信息表明当所述词组的拼音不能由包括在所述词组中的每一个中文字符的默认拼音形成时、包括在所述词组中具有多个拼音的中文字符从所述非默认拼音表中的拼音选择。
-
-
-
-
-