一种基于tesseract引擎的文字识别方法及装置

    公开(公告)号:CN105825214A

    公开(公告)日:2016-08-03

    申请号:CN201610143955.1

    申请日:2016-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于tesseract引擎的文字识别方法及其对应的装置,利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果,提高了tesseract引擎识别图像中文字的精度。本发明所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时,服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正,将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样,进行文字识别时则可以通过查询本地文字库来提升识别精度。本发明利用升级后的本地文字库修正tesseract引擎模块的识别结果,可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间,适合将日常学习与工作中的图片识别成文字。

    一种基于tesseract引擎的文字识别方法及装置

    公开(公告)号:CN105825214B

    公开(公告)日:2019-02-05

    申请号:CN201610143955.1

    申请日:2016-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于tesseract引擎的文字识别方法及其对应的装置,利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果,提高了tesseract引擎识别图像中文字的精度。本发明所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时,服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正,将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样,进行文字识别时则可以通过查询本地文字库来提升识别精度。本发明利用升级后的本地文字库修正tesseract引擎模块的识别结果,可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间,适合将日常学习与工作中的图片识别成文字。

Patent Agency Ranking