一种基于tesseract引擎的文字识别方法及装置

    公开(公告)号:CN105825214B

    公开(公告)日:2019-02-05

    申请号:CN201610143955.1

    申请日:2016-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于tesseract引擎的文字识别方法及其对应的装置,利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果,提高了tesseract引擎识别图像中文字的精度。本发明所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时,服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正,将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样,进行文字识别时则可以通过查询本地文字库来提升识别精度。本发明利用升级后的本地文字库修正tesseract引擎模块的识别结果,可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间,适合将日常学习与工作中的图片识别成文字。

    基于笔迹坐标序列的手写识别方法

    公开(公告)号:CN106407874A

    公开(公告)日:2017-02-15

    申请号:CN201610180051.6

    申请日:2016-03-25

    Applicant: 东南大学

    Abstract: 本发明公开一种基于笔迹坐标序列的文字识别方法。本发明先采集大量手写笔迹序列的数据,获得具有普适性的识别模型,之后,在实际使用中通过递归神经网络对用户的手写笔迹坐标序列进行训练,形成适应用户手写习惯的识别模型。由于记录了用户书写笔迹的时间特征,训练后可以形成适应用户手写习惯的识别模型,因而识别精度更高。本发明可以通过改变手写输入设备的采样频率,改变笔迹坐标序列的数据量,针对不同用户的手写速度调整训练模型计算速度,而且可以在手写过程中进行识别,识别效率更高。

    一种基于tesseract引擎的文字识别方法及装置

    公开(公告)号:CN105825214A

    公开(公告)日:2016-08-03

    申请号:CN201610143955.1

    申请日:2016-03-14

    Applicant: 东南大学

    Abstract: 本发明公开了一种基于tesseract引擎的文字识别方法及其对应的装置,利用云端服务器对本地文字库进行升级来修正tesseract引擎的识别结果,提高了tesseract引擎识别图像中文字的精度。本发明所述的文字识别装置包括服务器、tesseract引擎模块、云端服务器和本地文字库。升级本地文字库时,服务器采用云端服务器识别出的文字对tesseract引擎模块的识别结果进行修正,将tesseract引擎模块无法正确识别的文字补充进本地文字库。这样,进行文字识别时则可以通过查询本地文字库来提升识别精度。本发明利用升级后的本地文字库修正tesseract引擎模块的识别结果,可以达到与直接利用云端服务器进行文字识别相同的精度同时也可缩短文字识别运算的时间,适合将日常学习与工作中的图片识别成文字。

Patent Agency Ranking