-
公开(公告)号:CN102033859A
公开(公告)日:2011-04-27
申请号:CN200910176368.2
申请日:2009-09-28
Applicant: 佳能株式会社
Abstract: 本发明提供利用计算机压缩词典中的电子数据的方法,包括:输入待压缩词典,所述待压缩词典中存储有词与其发音;对于每个汉字,将出现次数最多的发音确定为默认发音,并且形成基于默认发音的第一字音映射表;对于每个多音汉字,将除默认发音之外的剩余发音确定为非默认发音,并且形成基于非默认发音的第二字音映射表;以及根据关于每个汉字与其发音的组合在第一或第二字音映射表中的索引或位置的信息,将该组合压缩为16比特编码,以形成包含具有16比特编码形式的信息的压缩词典,其中,所述16比特编码包括关于该汉字在第一或第二字音映射表中的索引的信息,以及关于该发音在第一或第二字音映射表中的索引的信息。
-
公开(公告)号:CN102033859B
公开(公告)日:2013-04-10
申请号:CN200910176368.2
申请日:2009-09-28
Applicant: 佳能株式会社
Abstract: 本发明提供利用计算机压缩词典中的电子数据的方法,包括:输入待压缩词典,所述待压缩词典中存储有词与其发音;对于每个汉字,将出现次数最多的发音确定为默认发音,并且形成基于默认发音的第一字音映射表;对于每个多音汉字,将除默认发音之外的剩余发音确定为非默认发音,并且形成基于非默认发音的第二字音映射表;以及根据关于每个汉字与其发音的组合在第一或第二字音映射表中的索引或位置的信息,将该组合压缩为16比特编码,以形成包含具有16比特编码形式的信息的压缩词典,其中,所述16比特编码包括关于该汉字在第一或第二字音映射表中的索引的信息,以及关于该发音在第一或第二字音映射表中的索引的信息。
-