-
公开(公告)号:CN117390450A
公开(公告)日:2024-01-12
申请号:CN202311413423.1
申请日:2023-10-27
Applicant: 航天信息股份有限公司
IPC: G06F18/214 , G06F18/21 , G06N3/0455 , G06N3/08
Abstract: 本申请提供了一种大语言模型训练方法、装置及相关设备,通过获取预训练大语言模型;采用初始微调数据集对预训练大语言模型进行微调,得到微调大语言模型;基于提问数据以及答复数据构建优化微调数据集,答复数据是由微调大语言模型输出的针对提问数据的答复数据;利用优化微调数据集,对微调大语言模型进行迭代优化,获得训练好的大语言模型。本申请的这种大语言模型训练方法,基于用户的使用反馈,不断迭代优化微调大语言模型的方法,在迭代优化微调大语言模型的过程中产生了大量的数据对优化数据集进行调整,可以有效的减少训练及优化过程使用的样本数据获取的成本,并有效提高调整后的大语言模型的性能。
-
公开(公告)号:CN112633275B
公开(公告)日:2023-07-18
申请号:CN202011525976.2
申请日:2020-12-22
Applicant: 航天信息股份有限公司
IPC: G06V30/146 , G06V30/18 , G06V10/82 , G06N3/08
Abstract: 本发明公开了一种基于深度学习的多票据混拍图像校正方法及系统,通过设计深度学习目标检测模型,将混拍图像切割为每个单目标票据外接矩形区域并标注类别信息,实现系统支持同时校正多个票据目标;在边缘检测之前通过增加图像增强处理,抑制票据目标复杂背景造成的边缘信息干扰,提高边缘检测精度,进而影响校正效果;通过图像校正中的直线检测、直线融合模和直线过滤处理,进一步过滤去除票据目标无关边缘信息,提高图像校正精度。本发明能够有效解决多票据混排图像校正问题,实现从多目标输入到多目标校正图像输出端对端一体化解决,降低人工成本和时间成本,为后续文本高精度识别提供保障。
-
公开(公告)号:CN114693902A
公开(公告)日:2022-07-01
申请号:CN202011561818.2
申请日:2020-12-25
Applicant: 航天信息股份有限公司
Abstract: 本申请公开了一种样本数据自动生成方法、装置及存储介质,涉及图像处理领域,用以减少收集数据时所占用的资源。该方法包括:将各待加载字段加载到背景图片的预设位置上,生成第一样本图片;将所述第一样本图片加载到预设三维模型上,得到样本模型;在三维空间对所述样本模型进行模拟拍照,得到第二样本图片。通过模拟生成平面图片,并对平面图片进行三维化,最终得到符合要求的三维OCR样本。这样,通过自动生成样本数据,可以代替现有技术中的收集数据的过程,从而减少收集数据时所占用的资源。
-
公开(公告)号:CN112749731A
公开(公告)日:2021-05-04
申请号:CN202011456986.5
申请日:2020-12-10
Applicant: 航天信息股份有限公司
Abstract: 本发明公开了一种基于深度神经网络的票据数量识别方法及系统,将获取的二维的混拍票据原始图像依次进行灰度化处理、二值化处理、归一化处理和二维图像映射一维数据处理,在保留图像信息的同时极大的降低数据量,减少数据传输造成的时间浪费,提升用户体验;通过设计OCTC模型,引入一维卷积操作对图像数据进行特征抽取与图像类别计算,使用多个小尺寸卷积核增大模型感受野,保证实验效果的同时降低模型参数量,实现轻量化模型的效果,便于用户储存使用;本发明的方法能够使用户在上传图像的同时能够收到图像中票据数量的判断结果,提升了混拍票据识别系统的用户体验,同时帮助系统进行后续的票据目标检测与内容识别任务,实现系统的实时工作。
-
公开(公告)号:CN114694160A
公开(公告)日:2022-07-01
申请号:CN202011586892.X
申请日:2020-12-29
Applicant: 航天信息股份有限公司
IPC: G06V30/413 , G06V10/82 , G06V10/764 , G06N3/08
Abstract: 本申请公开了一种票据的识别方法及票据识别装置,该方法包括:通过卷积神经网络模型对获取到的第一票据图像进行识别分析,以确定第一票据图像包含的至少一张票据各自在第一票据图像中的区域位置以及各自所属的票据类别;基于至少一张票据各自在第一票据图像中的区域位置,将第一票据图像切分成至少一张票据各自对应的票据子图像;基于至少一张票据各自对应的票据子图像以及各自所属的票据类别,对至少一张票据进行内容分析,获得至少一张票据各自包含的内容信息;基于至少一张票据各自包含的内容信息,生成格式化的票据内容,可以自动识别票据图像中包含的至少一张票据的票据内容,可以简化报销操作、节约成本,提高票据报销效率。
-
公开(公告)号:CN114627456A
公开(公告)日:2022-06-14
申请号:CN202011450876.8
申请日:2020-12-10
Applicant: 航天信息股份有限公司
IPC: G06V20/62 , G06V30/148 , G06V30/18 , G06V30/19 , G06K9/62
Abstract: 本发明提供一种票据文本信息检测方法、装置及系统,用于解决现有的票据文本信息检测方法中存在的票据文本的纵横比例差异较大,通用的目标检测算法无法直接应用到票据文本信息检测中,导致票据文本信息区域定位存在误差的问题,所述方法包括:对待检测票据图像进行特征提取处理,确定所述待检测票据图像的卷积特征图;采用预训练模型对所述待检测图像的卷积特征图进行处理,确定所述待检测票据图像上的矩形框以及对应的文本概率;根据所述待检测票据图像上的矩形框对应的文本概率,对所述文本概率大于第一预设阈值的矩形框进行合并处理,确定所述待检测票据图像上的票据文本信息区域。
-
公开(公告)号:CN114419653A
公开(公告)日:2022-04-29
申请号:CN202111544073.3
申请日:2021-12-16
Applicant: 航天信息股份有限公司
IPC: G06V30/42 , G06V30/148 , G06Q40/00
Abstract: 本发明公开了一种用于增值税发票识别的不含税价获取方法及系统,包括:获取目标增值税发票图像,按照不同属性对应的位置信息对所述目标增值税发票图像进行属性值的提取,以获取价税合计原始信息、合计税额和税率信息;确定所述价税合计原始信息中的数字信息,并按照预设转换规则对所述数字信息进行格式转换,以获取价税合计处理信息;根据所述税价合计处理信息、合计税额和税率信息,获取不含税价信息。本发明的方法能够降低增值税发票识别系统对通用模型准确率的依赖性,增加不含税价字段识别的普适性,使得该字段的识别能够适用于模型效果不一的识别系统中,实现增值税发票不含税价信息的准确提取。
-
公开(公告)号:CN114202766A
公开(公告)日:2022-03-18
申请号:CN202111428606.1
申请日:2021-11-29
Applicant: 航天信息股份有限公司
IPC: G06V30/412 , G06V30/414 , G06V30/42 , G06V30/146 , G06V30/164 , G06V30/19 , G06N3/04
Abstract: 本申请公开一种提取文本字段的方法、装置及电子设备,该方法包括获取包含文本字段的原始图像,并在原始图像中确定出各个目标图像区域,然后对各个目标图像区域中的文本字段进行文本识别,得到各个目标图像区域对应的文本字段,再根据预设提取规则,从文本字段中提取出满足业务需求的目标文本字段。基于上述方法,实现对完税证明图像中的目标文本字段的提取,解决现有技术中无法针对完税证明图像中满足业务需求的目标文本字段进行提取的问题,有效提高提取目标文本字段的准确率。
-
公开(公告)号:CN116363551A
公开(公告)日:2023-06-30
申请号:CN202211734521.0
申请日:2022-12-30
Applicant: 航天信息股份有限公司
IPC: G06V20/40 , G06V20/52 , G06V40/10 , G06V10/774 , G06V10/778
Abstract: 本发明公开了一种基于深度学习识别复杂场景人物的方法及系统,属于数据识别技术领域。本发明方法,包括:基于待监控复杂场景内的视频采集设备,采集待监控复杂场景内的视频数据,基于多种数据模型对所述视频数据进行解析识别,以获取所述视频数据的识别数据;基于所述识别数据及所述识别数据相对应的视频数据,生成检测模型;基于所述目标复杂场景内的视频采集设备,采集所述目标复杂场景内的目标视频数据;将所述目标视频数据输入至检测模型,基于所述监测模型对目标视频数据进行检测,以得到所述目标复杂场景内的人物识别数据。本发明能够用于对复杂场景内的人物进行识别。
-
公开(公告)号:CN113052164A
公开(公告)日:2021-06-29
申请号:CN202011581487.9
申请日:2020-12-28
Applicant: 航天信息股份有限公司
Abstract: 本公开涉及一种文本识别的方法、装置、存储介质及电子设备,可以获取多个待识别的局部文本图像;将所述局部文本图像输入预设文本识别模型,得到文本字符序列,所述预设文本识别模型包括残差神经网络Resnet网络,插入在所述Resnet网络残差层之间的非局部神经网络Non‑local网络,以及与所述Resnet网络连接的长短期记忆网络LSTM网络;根据所述文本字符序列确定文本识别结果。
-
-
-
-
-
-
-
-
-