一种模型训练方法、装置、存储介质及电子设备

    公开(公告)号:CN114283312A

    公开(公告)日:2022-04-05

    申请号:CN202111670232.4

    申请日:2021-12-31

    Inventor: 曾俊杰 刘曦 张睿

    Abstract: 本说明书提供了一种模型训练方法,通过待训练模型中的编码端和主解码端对有标签的第一训练样本和无标签的第二训练样本进行处理,得到第一文字行识别结果和第二文字行识别结果,随后对编码端从第二训练样本中提取出的第二特征进行加扰,得到带扰特征,并根据带扰特征得到带扰识别结果,将第一文字行识别结果与第一训练样本的标签之间的差异确定为第一差异,将第二文字行识别结果与带扰识别结果之间的差异确定为第二差异,根据第一差异和第二差异得到最终差异,并以最终差异最小化为优化目标,对编码端的参数进行调整。本方法通过对第二特征进行加扰的方式,使大量无标签训练样本得以利用,加强了训练出的模型的抗干扰能力,有效提高了模型的性能。

    对机器学习模型训练的方法和装置

    公开(公告)号:CN113988316A

    公开(公告)日:2022-01-28

    申请号:CN202111340905.X

    申请日:2021-11-12

    Inventor: 姜仟艺 宋祺 张睿

    Abstract: 本申请公开了一种对机器学习模型训练的方法和装置,属于人工智能领域。所述方法包括:获取第一样本图像、第二样本图像和所述第二样本图像对应的基准识别结果;对所述第一样本图像进行图像变化处理得到第三样本图像;基于待训练的图像字符识别模型和所述第一样本图像,确定第一识别结果,基于所述待训练的图像字符识别模型和所述第二样本图像,确定第二识别结果,基于所述待训练的图像字符识别模型和所述第三样本图像,确定第三识别结果;基于所述第一识别结果、所述第二识别结果、所述第三识别结果和所述基准识别结果,对所述待训练的图像字符识别模型进行参数调整。采用本申请,可以减少标注样本数据耗费的大量人力和时间。

    一种模型训练及图像处理方法、装置

    公开(公告)号:CN113688832A

    公开(公告)日:2021-11-23

    申请号:CN202110993903.4

    申请日:2021-08-27

    Abstract: 本说明书公开了一种模型训练及图像处理方法、装置。通过待训练的图像处理模型的第一模型中的对待处理图像进行处理并输出已处理图像,并且采用图像处理模型中的第二模型来预测已处理图像中各已处理区域与对应的标注图像的标注区之间的预测差异度,以根据预测差异度来为各已处理区域确定出区域权重,并通过以区域权重加权后的已处理图像和标注图像之间真实的标注差异度的最小为目标调整图像处理模型中的参数。使得在训练的过程中能够对预测差异度较大的区域投入更多的关注,从而避免待处理图像中需要进行处理的区域较小而导致模型训练得到较小的损失时所输出的已处理图像在需要处理的区域仍然难以得到较好的处理。

    文本信息处理方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110674396B

    公开(公告)日:2021-04-27

    申请号:CN201910804709.X

    申请日:2019-08-28

    Abstract: 本申请实施例提供了一种文本信息处理方法、装置、存储介质和电子设备,所述方法包括:对待修正的文本识别结果进行分词处理,得到多个文本条目;将所述待修正的文本识别结果输入搜索引擎,得到至少一条搜索结果;将所述多个文本条目中的每个文本条目与该条搜索结果分别进行匹配,以得到该文本条目在所述该条搜索结果中的匹配结果;将所述多个文本条目中的每个文本条目对应的匹配结果进行拼接,以得到所述至少一条搜索结果中每条搜索结果的拼接结果,各条所述拼接结果的集合形成候选结果集;将所述待修正的文本识别结果与所述候选结果集中的各条拼接结果分别进行匹配,确定修正后的文本识别结果。以提高文本识别结果纠错的准确率。

    图像文字识别方法、装置、电子设备

    公开(公告)号:CN112699882A

    公开(公告)日:2021-04-23

    申请号:CN202110020629.2

    申请日:2021-01-07

    Inventor: 宋祺 姜仟艺 张睿

    Abstract: 本申请公开了一种图像文字识别方法,属于计算机技术领域,有助于提升图像中文字识别的准确率。所述图像文字识别方法包括:将预先训练的编码‑解码网络模型应用于在线识别过程中,编码‑解码网络模型包括:至少两个编码模块、与每个所述编码模块对应的解码模块的,其中,每个编码模块用于从不同特征维度对输入图像进行编码,所述方法通过执行至少两个编码模块,对输入图像特征编码,分别得到每个编码模块的编码输出;分别执行每个解码模块,对相应编码模块的编码输出进行解码,得到各解码模块对输入图像的解码输出;对各解码模块对输入图像的解码输出,进行融合处理,确定所述编码‑解码网络模型对所述输入图像的文字识别结果。

    重复图像的检测方法、装置、电子设备及可读存储介质

    公开(公告)号:CN110781917B

    公开(公告)日:2021-03-02

    申请号:CN201910883029.1

    申请日:2019-09-18

    Abstract: 本申请实施例提供了一种重复图像的检测方法、装置、电子设备及可读存储介质,旨在提高重复图像检测结果的准确性和检测速度。所述方法包括:对待检测的第一图像和第二图像分别进行特征提取,得到第一图像的图像特征和第二图像的图像特征;根据所述第一图像的图像特征和所述第二图像的图像特征,确定所述第一图像和所述第二图像之间的全局相似度;在所述全局相似度处于重复图像疑似区间的情况下,根据所述第一图像和所述第二图像,获得多个特征组对;根据所述多个特征组对的相似度,确定所述第一图像和所述第二图像是否互为重复图像。

    一种OCR识别结果的置信度确定方法、装置及电子设备

    公开(公告)号:CN110765870B

    公开(公告)日:2021-01-12

    申请号:CN201910883642.3

    申请日:2019-09-18

    Inventor: 姜仟艺 宋祺 张睿

    Abstract: 本公开提供了一种OCR识别结果的置信度确定方法、装置及电子设备,该方法包括:将待识别图像输入到预先训练好的卷积神经网络中,得到多组输出结果;判断多组输出结果所包含的多个字符识别结果中,有效字符识别结果的数量是否大于预设数量;如果有效字符识别结果的数量小于预设数量,将0确定为OCR识别结果的置信度;如果有效字符识别结果的数量大于预设数量,通过归一化有效逻辑回归矩阵,得到有效字符识别结果中各个字符对应的概率值;并将所得到的概率值中最小的概率值确定为OCR识别结果的置信度。可见,通过本公开的实施例,在得到OCR识别结果的同时,还得到OCR识别结果的置信度,从而可以通过OCR识别结果的置信度来评估OCR识别结果的可靠程度。

    生成模型的方法、装置、可读存储介质及电子设备

    公开(公告)号:CN111898484A

    公开(公告)日:2020-11-06

    申请号:CN202010675753.8

    申请日:2020-07-14

    Abstract: 本公开涉及一种生成模型的方法、装置、可读存储介质及电子设备。方法包括:获取初始模型的至少一个目标初始网络层各自的初始参数矩阵和压缩比例;针对每一目标初始网络层,根据目标初始网络层的初始参数矩阵和压缩比例,对目标初始网络层进行压缩,以得到样本模型;获取样本数据集;根据样本数据集,对样本模型进行训练,以得到应用在样本数据集所属场景下的目标模型。如此,可以利用取值范围为大于0小于1的压缩比例对目标初始网络层进行压缩,使得压缩后的目标样本网络层中的参数数量小于初始网络层中的参数数量,进而减少了由目标样本网络层构成的样本模型的参数数量,使得目标模型的体积较小,有效地改善了目标模型的性能。

    一种数据标注的方法及装置

    公开(公告)号:CN111368902A

    公开(公告)日:2020-07-03

    申请号:CN202010131205.9

    申请日:2020-02-28

    Abstract: 本说明书公开了一种数据标注的方法及装置,在该方法中可以获取到待标注图像,并将待标注图像输入到预先训练的第一识别模型以及第二识别模型中,确定第一识别模型针对待标注图像的第一识别结果、第二识别模型针对待标注图像的第二识别结果。通过预先训练的判别模型,判断在第二识别模型输出第二识别结果的条件下,第一识别模型得到的第一识别结果是否正确,若确定第一识别结果正确,根据第一识别结果对待标注图像进行标注。本方法可以通过第一识别模型以及第二识别模型识别出待标注图像中的文本,再通过判别模型来判别第一识别模型得到的识别结果正确与否,实现对待标注图像的自动标注。因此本方法能够提高数据标注的效率,节约人工成本。

Patent Agency Ranking