-
公开(公告)号:CN117112823A
公开(公告)日:2023-11-24
申请号:CN202310929283.7
申请日:2023-07-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/583 , G06F16/55 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/042 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 公开了一种同源图像检索方法和系统,包括将教师网络和学生网络分别分为多个模块,将浅层特征提取模块和深层特征提取模块分别进行损失的约束和知识的蒸馏;在浅层特征上将所述教师网络训练输出的伪标签作为所述学生网络在浅层特征学习后输出的标签,计算软分类交叉熵损失;对深层特征的教师网络和学生网络编码输出进行相似度计算,在总损失函数中加上所述教师网络和所述学生网络的硬分类交叉熵损失,完成启发式的网络轻量化训练。本申请通过学生网络对教师网络的启发式学习,并同时考虑标签层面与特征层面的模型表征能力,约束了深浅不同层次的模型特征学习能力,使学生网络能够取得不低于教师网络的图像表征能力,实现了模型的轻量化。
-
公开(公告)号:CN112348015A
公开(公告)日:2021-02-09
申请号:CN202011238231.8
申请日:2020-11-09
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种基于级联神经网络的文字检测方法、装置及存储介质,该方法通过收集样本,并对样本进行处理生成数据集;搭建第一全卷积网络,通过数据集对第一全卷积网络进行训练至网络收敛,并通过训练后的第一全卷积网络对数据集进行推理,获得回归结果;搭建第二全卷积网络,通过回归结果对第二全卷积网络进行训练至网络收敛;将待验证图片输入第一全卷积网络,若第一全卷积网络判断在滑窗范围内存在文字,则裁剪下滑窗范围内的区域做双线性插值尺度变换并输入第二全卷积网络,通过第二全卷积网络判断区域是否为文字区域。该方法具有更好的泛化性能,并能够在保证检测准确率与召回率的同时,降低模型大小,从而提升文字检测算法性能。
-
公开(公告)号:CN115620327A
公开(公告)日:2023-01-17
申请号:CN202211321333.5
申请日:2022-10-26
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V30/413 , G06V30/19 , G06V10/82
Abstract: 本申请提出了一种基于多分类的文本检测方法以系统,包括:获取并整理文本框样本,将文本框样本切分成文本单元,对文本单元的坐标和标志位进行标注;将文本框样本按比例生成训练集和验证集,并且对文本单元的标志位赋类标;构建文本单元检测网络模型,通过文本单元检测网络模型对训练集进行训练至损失收敛,获取完成训练的模型输出,输出为集合B;构建文本单元合并算法,根据标志位的类标划分集合B,形成多个子集,根据当前元素和当前元素所属子集内的元素计算获取点集cnt外接矩形;将验证集输入完成训练的模型中,最终获得所有的文本框。能够有效解决自然场景下文本定位不准确、漏检、误检等多种问题,同时能够处理多角度的文本检测问题。
-
公开(公告)号:CN114219980A
公开(公告)日:2022-03-22
申请号:CN202111491247.4
申请日:2021-12-08
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/80 , G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明提出了一种基于多尺度的车型识别算法,包括:S1、将原图输入至ResNet50网络中进行卷积池化,对输出的特征信息进行广义均值池化,得到全局特征信息;S2、对所述原图进行移除背景处理,得到二值化掩膜,将所述二值化掩膜与所述原图相乘得到前景图像;S3、将所述前景图像输入至所述ResNet50网络的第一个残差卷积块,并将输出的特征信息输入至HRNet网络中,对所述HRNet网络输出的特征信息进行广义均值池化,得到多尺度特征信息;S4、对所述全局特征信息和所述多尺度特征信息进行级联得到级联特征,将所述级联特征输入至BN层和分类层,并利用三元组损失函数和交叉熵损失函数进行分类训练,从而识别车型。本发明具体提高车型识别精度的效果。
-
公开(公告)号:CN113920296A
公开(公告)日:2022-01-11
申请号:CN202111395021.4
申请日:2021-11-23
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种基于对比学习的文本识别方法与系统,包括无标签的文本图像样本,对其中每个样本进行数据增强输入卷积网络进行识别训练生成识别模型,再基于所述识别模型构建基本编码器来计算并输出特征序列;将所述特征序列输入实例映射函数生成对应的实例再映射为多个子实例,将所有的子实例作为对比损失函数中的子元素进行对比学习,将结果反馈到所述卷积网络用于更新所述卷积网络;获取包含文本信息的有标签的文本图像样本输入所述基本编码器,对所述卷积网络的参数进行调节直到所述识别模型收敛。本方法将对比学习应用于序列的各个元素,充分利用无标注数据学习有效的表征信息,再基于自监督对比学习的方法进行建模,显著提高了识别效果。
-
公开(公告)号:CN113807392A
公开(公告)日:2021-12-17
申请号:CN202110896904.7
申请日:2021-08-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种基于多预处理特征融合的篡改图像鉴别方法,其可包括以下步骤:S1、收集样本,构建训练集与验证集;S2、搭建多预处理特征提取模块;S3、将训练集中的每一张图像通过多预处理特征提取模块处理得到相应特征,并对同一张图像获取到的特征以通道维度合并,形成该图像的特征张量;S4、将特征张量输入神经网络模型进行训练直到损失收敛;S5、将验证集输入训练好的神经网络模型,获取输出结果,若输出结果大于预设阈值,则判定该图像为篡改图像。本发明通过提前提取先验特征的方式,使得模型更容易拟合到相关特征,更易于训练,能够实现对多种篡改方式进行同时鉴别。
-
公开(公告)号:CN114445436B
公开(公告)日:2025-04-11
申请号:CN202111628161.1
申请日:2021-12-28
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06T7/13 , G06T5/20 , G06T5/70 , G06N3/0464
Abstract: 本发明公开了一种目标检测的方法、装置以及存储介质。所述方法包括:获取待检测图像;对待检测图像进行边缘检测处理,得到第一图像;通过预设的特征提取网络对待检测图像进行处理,得到待检测图像的第二图像,使用第一图像对第二图像进行处理,增强第二图像的边缘特征;预设的特征提取网络包含特征降噪模块,使用特征降噪模块对增强边缘特征的第二图像进行降噪处理;使用预设的特征提取网络对降噪处理后的第二图像进行处理,得到图像特征,将图像特征输入预设的目标检测网络,得到目标类别和目标框。本发明提供的一种目标检测的方法和装置,能够提升基于深度学习神经网络的特征提取网络的特征提取能力,以及目标检测网络的目标检测能力。
-
公开(公告)号:CN117195222A
公开(公告)日:2023-12-08
申请号:CN202310959070.9
申请日:2023-08-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F21/57 , G06F21/71 , G06N3/094 , G06N3/0455 , G06V10/82
Abstract: 公开了基于对抗网络的深度神经网络对抗攻击防御的方法和系统,包括搭建深度神经网络随机对抗攻击模块,深度神经网络随机对抗攻击模块包括多个并联的对抗攻击算法,随机对输入图像进行对抗攻击加噪;搭建可微分频域正则化器,可微分频域正则化器对频域信息对模型输出进行正则化处理;搭建对抗防御网络架构,对抗防御网络以基于编码解码结构的生成对抗网络作为主干网络,并引入深度神经网络随机对抗攻击模块和可微分频域正则化器;收集自然场景下的图像,按比例形成训练集和验证集,使用训练集对对抗防御网络进行训练至损失收敛。本申请能够明显提升深度神经网络对抗攻击防御能力,对多种对抗攻击方式均有良好的泛化性能。
-
公开(公告)号:CN114078119A
公开(公告)日:2022-02-22
申请号:CN202111372017.6
申请日:2021-11-18
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了一种基于光流法的深度伪造视频检测方法和系统,包括收集经过不同方式篡改后的深度伪造视频和原始视频分别构建训练集和验证集;对训练集和验证集中的视频进行抽帧处理获得每个视频的每帧图像,利用光流计算模型提取光流特征;按时序分别对每帧图像和光流特征进行拼接,并输入神经网络模型训练至损失收敛;对待验证视频进行上述步骤中抽帧处理、光流计算和图像拼接,并取部分图像送入神经网络模型,将获取到的输出通过神经网络的激活函数获得输出结果均值,若输出结果均值不小于预设阈值,则待验证视频为深度伪造视频。本发明能够降低深度伪造检测算法对前置算法的强依赖性,同时能够有效的对多种深度伪造视频进行检测,提升算法泛化能力。
-
公开(公告)号:CN116029366A
公开(公告)日:2023-04-28
申请号:CN202211692290.1
申请日:2022-12-28
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06N3/096 , G06V30/19 , G06N3/0455
Abstract: 本发明提出了一种基于重编码的文本识别模型压缩方法及系统,该方法包括以下步骤:S1、获取并整理原始样本,使用原始样本对第一文本识别模型进行训练;S2、对训练好的第一文本识别模型进行知识蒸馏,获得压缩后的第二文本识别模型;S3、保留第二文本识别模型的主干网络,重新搭建第二文本识别模型的分类层,获得第三文本识别模型;以及S4、对原始样本进行重新标注处理,获得待测样本,使用待测样本对第三文本识别模型进行训练,并且对训练好的第三文本识别模型进行网络性能验证。该方法能够对大字库模型进行充分压缩,避免对模型识别精度带来明显影响,提升模型推理速度,减小模型规模,使模型充分满足实际业务场景需求。
-
-
-
-
-
-
-
-
-