-
公开(公告)号:CN116029366A
公开(公告)日:2023-04-28
申请号:CN202211692290.1
申请日:2022-12-28
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06N3/096 , G06V30/19 , G06N3/0455
Abstract: 本发明提出了一种基于重编码的文本识别模型压缩方法及系统,该方法包括以下步骤:S1、获取并整理原始样本,使用原始样本对第一文本识别模型进行训练;S2、对训练好的第一文本识别模型进行知识蒸馏,获得压缩后的第二文本识别模型;S3、保留第二文本识别模型的主干网络,重新搭建第二文本识别模型的分类层,获得第三文本识别模型;以及S4、对原始样本进行重新标注处理,获得待测样本,使用待测样本对第三文本识别模型进行训练,并且对训练好的第三文本识别模型进行网络性能验证。该方法能够对大字库模型进行充分压缩,避免对模型识别精度带来明显影响,提升模型推理速度,减小模型规模,使模型充分满足实际业务场景需求。
-
公开(公告)号:CN115620327A
公开(公告)日:2023-01-17
申请号:CN202211321333.5
申请日:2022-10-26
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V30/413 , G06V30/19 , G06V10/82
Abstract: 本申请提出了一种基于多分类的文本检测方法以系统,包括:获取并整理文本框样本,将文本框样本切分成文本单元,对文本单元的坐标和标志位进行标注;将文本框样本按比例生成训练集和验证集,并且对文本单元的标志位赋类标;构建文本单元检测网络模型,通过文本单元检测网络模型对训练集进行训练至损失收敛,获取完成训练的模型输出,输出为集合B;构建文本单元合并算法,根据标志位的类标划分集合B,形成多个子集,根据当前元素和当前元素所属子集内的元素计算获取点集cnt外接矩形;将验证集输入完成训练的模型中,最终获得所有的文本框。能够有效解决自然场景下文本定位不准确、漏检、误检等多种问题,同时能够处理多角度的文本检测问题。
-
公开(公告)号:CN117095329A
公开(公告)日:2023-11-21
申请号:CN202310959022.X
申请日:2023-08-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 公开了一种减缓行人属性识别类内变化的方法和系统,包括接收数据集中任一张图像xi输入主干网络进行多标签分类任务的行人属性识别,采用二值交叉熵作为损失函数;利用指数信息瓶颈作用于主干网络的每个卷积模块和注意力机制模块,过滤特征中存在的冗余干扰特征信息。本申请提出的指数信息瓶颈方法可以集成到注意力模块中,形成一个新颖的行人熟悉识别网络,可以进一步处理基于注意力机制的属性内变化,指数信息瓶颈方法是即插即用的,在推理期间没有任何额外的计算开销。
-
公开(公告)号:CN115578714A
公开(公告)日:2023-01-06
申请号:CN202211183158.8
申请日:2022-09-27
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了一种基于浅层特征信息增强的车辆颜色识别方法和系统,包括在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。浅层特征信息增强模块可灵活的插入卷积神经网络任意位置,增强特征信息,增加模型的泛化性。
-
公开(公告)号:CN115546907A
公开(公告)日:2022-12-30
申请号:CN202211153579.6
申请日:2022-09-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了多尺度特征聚合的活体检测方法和系统,包括将RGB图像通过图像变换转换为HSV图像,将RGB图像和HSV图像融合为RGB‑HSV图像并送入主干网络;将主干网络提取的特征送入特征深度拓展模块,并将输出送入多特征提取模块以获得更多的上下文信息;将最终输出经过池化层和分类层,并在交叉熵损失函数的约束下进行训练。本发明提出的一种多尺度特征聚合的活体检测方法和系统,其具有参数量小、对图像的接受域大、多尺度特征聚合的特点,利用了空洞卷积以扩大网络的感受野,获取更多的上下文信息,利用RGB图像和HSV图像作为6通道的图像作为输入,运行速度与仅使用RGB图像的运行速度是一致的,在性能和效率之间取得了很好的平衡。
-
公开(公告)号:CN117195222A
公开(公告)日:2023-12-08
申请号:CN202310959070.9
申请日:2023-08-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F21/57 , G06F21/71 , G06N3/094 , G06N3/0455 , G06V10/82
Abstract: 公开了基于对抗网络的深度神经网络对抗攻击防御的方法和系统,包括搭建深度神经网络随机对抗攻击模块,深度神经网络随机对抗攻击模块包括多个并联的对抗攻击算法,随机对输入图像进行对抗攻击加噪;搭建可微分频域正则化器,可微分频域正则化器对频域信息对模型输出进行正则化处理;搭建对抗防御网络架构,对抗防御网络以基于编码解码结构的生成对抗网络作为主干网络,并引入深度神经网络随机对抗攻击模块和可微分频域正则化器;收集自然场景下的图像,按比例形成训练集和验证集,使用训练集对对抗防御网络进行训练至损失收敛。本申请能够明显提升深度神经网络对抗攻击防御能力,对多种对抗攻击方式均有良好的泛化性能。
-
公开(公告)号:CN117011809A
公开(公告)日:2023-11-07
申请号:CN202310764791.4
申请日:2023-06-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V20/54 , G06V10/26 , G06V10/44 , G06V10/774 , G06V10/74
Abstract: 公开了一种多任务引导式的车辆检索方法和系统,包括利用ResNet50作为多任务引导式车辆检索方法的主干网络,主干网络包括4个用于提取车辆特征的残差卷积块Stage1、Stage2、Stage3、Stage4;定义车辆检索任务的损失函数为三元组损失函数Ltriplet和标签平滑正则化的交叉熵损失函数#imgabs0#将Stage4提取的特征输出至解压模块,利用反卷积分割车辆的整体轮廓信息,整体任务的损失函数#imgabs1##imgabs2#其中,β为超参数,LMASK表示车辆分割任务的损失函数。本申请引入车辆分割任务,大幅度提升了车辆检索任务的性能。
-
公开(公告)号:CN117112823A
公开(公告)日:2023-11-24
申请号:CN202310929283.7
申请日:2023-07-27
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/583 , G06F16/55 , G06V10/44 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/042 , G06N3/0455 , G06N3/047 , G06N3/08
Abstract: 公开了一种同源图像检索方法和系统,包括将教师网络和学生网络分别分为多个模块,将浅层特征提取模块和深层特征提取模块分别进行损失的约束和知识的蒸馏;在浅层特征上将所述教师网络训练输出的伪标签作为所述学生网络在浅层特征学习后输出的标签,计算软分类交叉熵损失;对深层特征的教师网络和学生网络编码输出进行相似度计算,在总损失函数中加上所述教师网络和所述学生网络的硬分类交叉熵损失,完成启发式的网络轻量化训练。本申请通过学生网络对教师网络的启发式学习,并同时考虑标签层面与特征层面的模型表征能力,约束了深浅不同层次的模型特征学习能力,使学生网络能够取得不低于教师网络的图像表征能力,实现了模型的轻量化。
-
-
-
-
-
-
-