-
公开(公告)号:CN118470734A
公开(公告)日:2024-08-09
申请号:CN202211719873.9
申请日:2022-12-30
Applicant: 航天信息股份有限公司
IPC: G06V30/413 , G06V30/414 , G06T3/4038 , G06T5/50 , G06F40/232 , G06N3/0464 , G06N3/0442 , G06N3/088
Abstract: 本发明公开了一种基于文本识别的票据录入的方法及系统,该方法包括:采集发票的票据图像,所述票据图像包括票据类别及对应的文本信息;将所述票据图像输入混拍检测模型进行切片处理,得到票据特征图;将所述票据特征图发送至文本检测模型进行检测,获得包含文本信息的包围框,所述票据特征图与所述文本检测模型的票据类型相对应;将所述包围框发送至文本识别模型中进行文本识别,获得文本识别结果;将所述文本识别结果发送至文本纠错模型,对识别出来的文本中的中文结果进行中文纠错,得到改善后的文本信息,将改善后的文本信息作为票据关键信息;将所述票据关键信息存储到数据库中。
-
公开(公告)号:CN117521102A
公开(公告)日:2024-02-06
申请号:CN202311490088.5
申请日:2023-11-09
Applicant: 航天信息股份有限公司
IPC: G06F21/60 , G06F21/78 , G06F18/214 , G06N3/098
Abstract: 本发明公开了一种基于联邦学习的模型训练方法及装置,包括:第一端根据自身的第一数据集和第一模型的参数确定第一训练参数;保证第一端的数据不出本地,防止数据泄露。基于第一公钥确定第一训练参数的第一密文,并发送至第二端,以使第二端根据第二数据集、第二模型的参数和第一训练参数的第一密文确定第一模型的第一梯度密文;其中,第一模型的第一梯度密文表示第一模型的梯度根据第一公钥加密后的结果;进而第一端根据第一私钥对第一模型的第一梯度密文进行解密,得到第一模型的梯度,以此对第一模型进行迭代。实现第一端和第二端之间的以密文的形式进行数据交互,既实现基于联邦学习的模型训练,又保证训练过程中数据的安全性。
-
公开(公告)号:CN114445839A
公开(公告)日:2022-05-06
申请号:CN202111589671.2
申请日:2021-12-23
Applicant: 航天信息股份有限公司
IPC: G06V30/412 , G06K9/62 , G06N20/00 , G06V10/22 , G06V10/25 , G06V10/774
Abstract: 本发明公开了一种用于对公文中表格内容进行识别的方法及系统,方法包括:获取公文文档图像,进行预处理;基于深度学习算法对经过预处理的公文文档图像进行文本框位置检测和文本框内容识别,获取每个文本框的文本框位置信息,以及对应的文本框内容信息;对公文文档图像中的表格整体单元格进行检测,检测出所有横线和所有竖线;基于检测出的所有横线和所有竖线获取小单元格位置信息;基于文本框位置信息和小单元格位置信息,判断文本框是否与小单元格相对应;当两者相对应时,基于文本框位置信息对文本框进行排序,获取排序后的文本框内容信息;基于排序后的文本框内容信息确定表格整体单元格的内容排布,输出结构化文本信息。
-
公开(公告)号:CN116363551A
公开(公告)日:2023-06-30
申请号:CN202211734521.0
申请日:2022-12-30
Applicant: 航天信息股份有限公司
IPC: G06V20/40 , G06V20/52 , G06V40/10 , G06V10/774 , G06V10/778
Abstract: 本发明公开了一种基于深度学习识别复杂场景人物的方法及系统,属于数据识别技术领域。本发明方法,包括:基于待监控复杂场景内的视频采集设备,采集待监控复杂场景内的视频数据,基于多种数据模型对所述视频数据进行解析识别,以获取所述视频数据的识别数据;基于所述识别数据及所述识别数据相对应的视频数据,生成检测模型;基于所述目标复杂场景内的视频采集设备,采集所述目标复杂场景内的目标视频数据;将所述目标视频数据输入至检测模型,基于所述监测模型对目标视频数据进行检测,以得到所述目标复杂场景内的人物识别数据。本发明能够用于对复杂场景内的人物进行识别。
-
公开(公告)号:CN116264007A
公开(公告)日:2023-06-16
申请号:CN202111515187.5
申请日:2021-12-13
Applicant: 航天信息股份有限公司
IPC: G06V20/62 , G06V30/40 , G06V10/22 , G06V30/146
Abstract: 本申请公开了一种图像处理方法、装置及电子设备。该方法为:获取待识别的票据图像;从所述票据图像中确定包含文字信息的文字区域;对所述文字区域进行文字识别处理,得到所述票据图像中的文字信息。由此实现了快速生成需要采集的数据,而且降低时间成本和经济成本。
-
公开(公告)号:CN113052164A
公开(公告)日:2021-06-29
申请号:CN202011581487.9
申请日:2020-12-28
Applicant: 航天信息股份有限公司
Abstract: 本公开涉及一种文本识别的方法、装置、存储介质及电子设备,可以获取多个待识别的局部文本图像;将所述局部文本图像输入预设文本识别模型,得到文本字符序列,所述预设文本识别模型包括残差神经网络Resnet网络,插入在所述Resnet网络残差层之间的非局部神经网络Non‑local网络,以及与所述Resnet网络连接的长短期记忆网络LSTM网络;根据所述文本字符序列确定文本识别结果。
-
公开(公告)号:CN112633275A
公开(公告)日:2021-04-09
申请号:CN202011525976.2
申请日:2020-12-22
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种基于深度学习的多票据混拍图像校正方法及系统,通过设计深度学习目标检测模型,将混拍图像切割为每个单目标票据外接矩形区域并标注类别信息,实现系统支持同时校正多个票据目标;在边缘检测之前通过增加图像增强处理,抑制票据目标复杂背景造成的边缘信息干扰,提高边缘检测精度,进而影响校正效果;通过图像校正中的直线检测、直线融合模和直线过滤处理,进一步过滤去除票据目标无关边缘信息,提高图像校正精度。本发明能够有效解决多票据混排图像校正问题,实现从多目标输入到多目标校正图像输出端对端一体化解决,降低人工成本和时间成本,为后续文本高精度识别提供保障。
-
公开(公告)号:CN116052147A
公开(公告)日:2023-05-02
申请号:CN202211719839.1
申请日:2022-12-30
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种基于深度学习的轻量级文本检测方法及系统。其中,该方法包括:包括:获取文本数据集,对所述文本数据集中的文本图片进行增强,使得所述文本图片更加真实,所述文本数据集包括公开文本数据集以及生成文本数据集;将增强后的文本数据集中的文本图片切分成固定宽度的多个小文本,并构建轻量级文本检测模型,将所述多个小文本输入所述轻量级文本检测模型进行训练并进行优化,输出文本检测模型;采集文本图像后输入文本检测模型进行预测,得到模型输出结果,对所述模型输出结果进行筛选,得到满足条件的矩形文本框;通过自适应调整阈值,将多个满足条件的矩形文本框进行合并,经过合并后输出最终的文本检测结果。
-
公开(公告)号:CN115565197A
公开(公告)日:2023-01-03
申请号:CN202211162303.4
申请日:2022-09-23
Applicant: 航天信息股份有限公司
IPC: G06V30/42 , G06V30/412 , G06V30/414 , G06V30/26 , G06V30/24 , G06V30/148 , G06V30/416 , G06V10/82 , G06T7/73 , G06N3/04
Abstract: 本申请提供一种表单信息识别方法、装置及相关设备,其中,所述表单信息识别方法包括:对待识别表单图像中包括的表格进行检测,确定表格的位置信息;根据表格的位置信息,确定包含目标文本信息的文本框图像,将待识别表单图像进行分割;对文本框图像进行文本识别,确定文本信息的识别结果;对文本信息的识别结果进行目标字段检索,确定目标字段的候选列表;根据目标字段的候选列表和表格位置信息,确定对待识别表单图像中包含目标信息的识别结果。能够适应对各种不同的表单图像进行文本信息的识别需求,保证对包含诸如姓名、字母或者其他特殊字符或字段进行识别提取的准确率,过程简单可靠,识别适用性广。
-
公开(公告)号:CN114627457A
公开(公告)日:2022-06-14
申请号:CN202011460902.5
申请日:2020-12-11
Applicant: 航天信息股份有限公司
Abstract: 本申请涉及计算机视觉技术领域,尤其涉及一种票面信息识别方法及装置,从获取到的待识别图像中检测获得各文本区域图像;分别针对所述各文本区域图像,将任意一张文本区域图像输入至已训练的文本识别模型,对该文本区域图像的特征序列进行字符预测,获得所述特征序列中的每一帧特征所属文本字符的概率分布,根据各概率分布,确定出该文本区域图像中包含的文本字符串;根据确定出的各文本字符串和预设的票面信息模板,生成票面信息,这样,通过文本识别模型对文本区域图像进行识别,获得文本字符串,相比于现有技术中对单个汉字进行识别来说,能够提高识别的准确率。
-
-
-
-
-
-
-
-
-