一种基于文本识别的票据录入的装置及方法

    公开(公告)号:CN118470734A

    公开(公告)日:2024-08-09

    申请号:CN202211719873.9

    申请日:2022-12-30

    Abstract: 本发明公开了一种基于文本识别的票据录入的方法及系统,该方法包括:采集发票的票据图像,所述票据图像包括票据类别及对应的文本信息;将所述票据图像输入混拍检测模型进行切片处理,得到票据特征图;将所述票据特征图发送至文本检测模型进行检测,获得包含文本信息的包围框,所述票据特征图与所述文本检测模型的票据类型相对应;将所述包围框发送至文本识别模型中进行文本识别,获得文本识别结果;将所述文本识别结果发送至文本纠错模型,对识别出来的文本中的中文结果进行中文纠错,得到改善后的文本信息,将改善后的文本信息作为票据关键信息;将所述票据关键信息存储到数据库中。

    一种基于联邦学习的模型训练方法及装置

    公开(公告)号:CN117521102A

    公开(公告)日:2024-02-06

    申请号:CN202311490088.5

    申请日:2023-11-09

    Abstract: 本发明公开了一种基于联邦学习的模型训练方法及装置,包括:第一端根据自身的第一数据集和第一模型的参数确定第一训练参数;保证第一端的数据不出本地,防止数据泄露。基于第一公钥确定第一训练参数的第一密文,并发送至第二端,以使第二端根据第二数据集、第二模型的参数和第一训练参数的第一密文确定第一模型的第一梯度密文;其中,第一模型的第一梯度密文表示第一模型的梯度根据第一公钥加密后的结果;进而第一端根据第一私钥对第一模型的第一梯度密文进行解密,得到第一模型的梯度,以此对第一模型进行迭代。实现第一端和第二端之间的以密文的形式进行数据交互,既实现基于联邦学习的模型训练,又保证训练过程中数据的安全性。

    一种用于对公文中表格内容进行识别的方法及系统

    公开(公告)号:CN114445839A

    公开(公告)日:2022-05-06

    申请号:CN202111589671.2

    申请日:2021-12-23

    Abstract: 本发明公开了一种用于对公文中表格内容进行识别的方法及系统,方法包括:获取公文文档图像,进行预处理;基于深度学习算法对经过预处理的公文文档图像进行文本框位置检测和文本框内容识别,获取每个文本框的文本框位置信息,以及对应的文本框内容信息;对公文文档图像中的表格整体单元格进行检测,检测出所有横线和所有竖线;基于检测出的所有横线和所有竖线获取小单元格位置信息;基于文本框位置信息和小单元格位置信息,判断文本框是否与小单元格相对应;当两者相对应时,基于文本框位置信息对文本框进行排序,获取排序后的文本框内容信息;基于排序后的文本框内容信息确定表格整体单元格的内容排布,输出结构化文本信息。

    一种基于深度学习识别复杂场景人物的方法及系统

    公开(公告)号:CN116363551A

    公开(公告)日:2023-06-30

    申请号:CN202211734521.0

    申请日:2022-12-30

    Abstract: 本发明公开了一种基于深度学习识别复杂场景人物的方法及系统,属于数据识别技术领域。本发明方法,包括:基于待监控复杂场景内的视频采集设备,采集待监控复杂场景内的视频数据,基于多种数据模型对所述视频数据进行解析识别,以获取所述视频数据的识别数据;基于所述识别数据及所述识别数据相对应的视频数据,生成检测模型;基于所述目标复杂场景内的视频采集设备,采集所述目标复杂场景内的目标视频数据;将所述目标视频数据输入至检测模型,基于所述监测模型对目标视频数据进行检测,以得到所述目标复杂场景内的人物识别数据。本发明能够用于对复杂场景内的人物进行识别。

    一种基于深度学习的多票据混拍图像校正方法及系统

    公开(公告)号:CN112633275A

    公开(公告)日:2021-04-09

    申请号:CN202011525976.2

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于深度学习的多票据混拍图像校正方法及系统,通过设计深度学习目标检测模型,将混拍图像切割为每个单目标票据外接矩形区域并标注类别信息,实现系统支持同时校正多个票据目标;在边缘检测之前通过增加图像增强处理,抑制票据目标复杂背景造成的边缘信息干扰,提高边缘检测精度,进而影响校正效果;通过图像校正中的直线检测、直线融合模和直线过滤处理,进一步过滤去除票据目标无关边缘信息,提高图像校正精度。本发明能够有效解决多票据混排图像校正问题,实现从多目标输入到多目标校正图像输出端对端一体化解决,降低人工成本和时间成本,为后续文本高精度识别提供保障。

    一种基于深度学习的轻量级文本检测方法及系统

    公开(公告)号:CN116052147A

    公开(公告)日:2023-05-02

    申请号:CN202211719839.1

    申请日:2022-12-30

    Abstract: 本发明公开了一种基于深度学习的轻量级文本检测方法及系统。其中,该方法包括:包括:获取文本数据集,对所述文本数据集中的文本图片进行增强,使得所述文本图片更加真实,所述文本数据集包括公开文本数据集以及生成文本数据集;将增强后的文本数据集中的文本图片切分成固定宽度的多个小文本,并构建轻量级文本检测模型,将所述多个小文本输入所述轻量级文本检测模型进行训练并进行优化,输出文本检测模型;采集文本图像后输入文本检测模型进行预测,得到模型输出结果,对所述模型输出结果进行筛选,得到满足条件的矩形文本框;通过自适应调整阈值,将多个满足条件的矩形文本框进行合并,经过合并后输出最终的文本检测结果。

    一种票面信息识别方法及装置
    10.
    发明公开

    公开(公告)号:CN114627457A

    公开(公告)日:2022-06-14

    申请号:CN202011460902.5

    申请日:2020-12-11

    Abstract: 本申请涉及计算机视觉技术领域,尤其涉及一种票面信息识别方法及装置,从获取到的待识别图像中检测获得各文本区域图像;分别针对所述各文本区域图像,将任意一张文本区域图像输入至已训练的文本识别模型,对该文本区域图像的特征序列进行字符预测,获得所述特征序列中的每一帧特征所属文本字符的概率分布,根据各概率分布,确定出该文本区域图像中包含的文本字符串;根据确定出的各文本字符串和预设的票面信息模板,生成票面信息,这样,通过文本识别模型对文本区域图像进行识别,获得文本字符串,相比于现有技术中对单个汉字进行识别来说,能够提高识别的准确率。

Patent Agency Ranking