基于阿拉伯字符集的印刷体字符识别方法

    公开(公告)号:CN1266643C

    公开(公告)日:2006-07-26

    申请号:CN200410009785.5

    申请日:2004-11-12

    Applicant: 清华大学

    Abstract: 基于阿拉伯字符集的印刷体字符识别方法属于字符识别领域,其特征在于,提取阿拉伯字符集中字符独特的区域信息、字符形式信息、构成部件信息进行预分类,确定输入字符所属的字符类别子集,然后抽取能很好反映字符笔划构成信息的方向特征,在此基础上采用两个步骤进行特征优化处理:1.特征整形;2.由LDA(线性鉴别分析)和K-L变换相结合的特征变换,最后运用MQDF(改进的二次鉴别函数)统计分类器进行分类判决。本发明在多字体多字号维吾尔、哈萨克、柯尔克孜和阿拉伯印刷体字符测试集上的识别正确率均达到99.4%以上。

Patent Agency Ranking