一种仪表液晶数字自动切分和识别的方法及系统

    公开(公告)号:CN106960208A

    公开(公告)日:2017-07-18

    申请号:CN201710195624.7

    申请日:2017-03-28

    Abstract: 本发明公开了一种仪表液晶数字自动切分和识别的方法及系统,所述仪表液晶数字自动切分和识别的系统包括图像预处理模块、小数点识别模块、字符切分模块、字符识别模块四个模块,所述仪表液晶数字自动切分和识别的方法包括图像预处理、小数点识别、字符切分、字符识别四个步骤。相对于现有技术,本发明具有如下优点:1、预处理部分对于亮度变化较大的图像具有很高的鲁棒性,能很好地将液晶数字与背景区分开来;2、对于图像中的小数点能够准确地识别出来;3、单个液晶数字识别率为98%,而整串完全识别正确的成功率达到97%。

    一种面向手写文字的一阶段自动识别与翻译方法

    公开(公告)号:CN110765966A

    公开(公告)日:2020-02-07

    申请号:CN201911046777.0

    申请日:2019-10-30

    Abstract: 本发明公开了一种面向手写文字的一阶段自动识别与翻译方法,所述方法主要包含文本识别方法和端到端识别与翻译方法。该方法使用注意力机制代替CRNN中的RNN结构,使计算可以并行化,降低计算成本;在Transformer模型的训练过程中对解码器的输入做随机替换,模拟预测过程中预测出错的情况,缓解了过拟合问题;提出了一种端到端的识别与翻译模型,使用基于迁移学习的方式训练端到端模型,不需要显式给出识别结果,直接对图片内容做翻译。本发明具有如下优点:1、文本识别模型的训练速度大幅提高。2、训练阶段随机替换解码器输入,使得识别模型的泛化能力大幅提高。3、端到端识别与翻译模型的翻译准确率高于两阶段模型。

    一种面向手写文字的一阶段自动识别与翻译方法

    公开(公告)号:CN110765966B

    公开(公告)日:2022-03-25

    申请号:CN201911046777.0

    申请日:2019-10-30

    Abstract: 本发明公开了一种面向手写文字的一阶段自动识别与翻译方法,所述方法主要包含文本识别方法和端到端识别与翻译方法。该方法使用注意力机制代替CRNN中的RNN结构,使计算可以并行化,降低计算成本;在Transformer模型的训练过程中对解码器的输入做随机替换,模拟预测过程中预测出错的情况,缓解了过拟合问题;提出了一种端到端的识别与翻译模型,使用基于迁移学习的方式训练端到端模型,不需要显式给出识别结果,直接对图片内容做翻译。本发明具有如下优点:1、文本识别模型的训练速度大幅提高。2、训练阶段随机替换解码器输入,使得识别模型的泛化能力大幅提高。3、端到端识别与翻译模型的翻译准确率高于两阶段模型。

    一种仪表液晶数字自动切分和识别的方法及系统

    公开(公告)号:CN106960208B

    公开(公告)日:2020-03-31

    申请号:CN201710195624.7

    申请日:2017-03-28

    Abstract: 本发明公开了一种仪表液晶数字自动切分和识别的方法及系统,所述仪表液晶数字自动切分和识别的系统包括图像预处理模块、小数点识别模块、字符切分模块、字符识别模块四个模块,所述仪表液晶数字自动切分和识别的方法包括图像预处理、小数点识别、字符切分、字符识别四个步骤。相对于现有技术,本发明具有如下优点:1、预处理部分对于亮度变化较大的图像具有很高的鲁棒性,能很好地将液晶数字与背景区分开来;2、对于图像中的小数点能够准确地识别出来;3、单个液晶数字识别率为98%,而整串完全识别正确的成功率达到97%。

    一种低分辨率医疗票据图像的文字自动提取和识别系统与方法

    公开(公告)号:CN105654072B

    公开(公告)日:2019-03-01

    申请号:CN201610172317.2

    申请日:2016-03-24

    Abstract: 本发明公开了一种低分辨率医疗票据图像的文字自动提取和识别系统与方法,所述系统包括图像预处理模块、字段切分模块、单字符切分模块、字符识别模块四大模块,所述方法包括据图像的预处理、字段区域识别、字符串分割和字符识别与验证四大步骤。本发明能够更好的适用于低分辨率医疗票据图像的文字自动提取和识别。通过对票据进行版面分析,能够充分利用这些信息。对于图像质量较低,噪声和图像分辨率影响非常大的图像,利用每个字段区域的语义,有助于将字符串切分成单个字符,从而转化为对单字符的识别。比如,将由纯数字组成的发票号,可以使用专门用于处理只有数字的图像的方法;识别的时候,将识别范围再限制在0~9这十个数字中,识别率即可大大提高。

    一种低分辨率医疗票据图像的文字自动提取和识别系统与方法

    公开(公告)号:CN105654072A

    公开(公告)日:2016-06-08

    申请号:CN201610172317.2

    申请日:2016-03-24

    CPC classification number: G06K9/00449 G06K9/2054 G06K9/40

    Abstract: 本发明公开了一种低分辨率医疗票据图像的文字自动提取和识别系统与方法,所述系统包括图像预处理模块、字段切分模块、单字符切分模块、字符识别模块四大模块,所述方法包括据图像的预处理、字段区域识别、字符串分割和字符识别与验证四大步骤。本发明能够更好的适用于低分辨率医疗票据图像的文字自动提取和识别。通过对票据进行版面分析,能够充分利用这些信息。对于图像质量较低,噪声和图像分辨率影响非常大的图像,利用每个字段区域的语义,有助于将字符串切分成单个字符,从而转化为对单字符的识别。比如,将由纯数字组成的发票号,可以使用专门用于处理只有数字的图像的方法;识别的时候,将识别范围再限制在0~9这十个数字中,识别率即可大大提高。

Patent Agency Ranking