-
公开(公告)号:CN112348015A
公开(公告)日:2021-02-09
申请号:CN202011238231.8
申请日:2020-11-09
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种基于级联神经网络的文字检测方法、装置及存储介质,该方法通过收集样本,并对样本进行处理生成数据集;搭建第一全卷积网络,通过数据集对第一全卷积网络进行训练至网络收敛,并通过训练后的第一全卷积网络对数据集进行推理,获得回归结果;搭建第二全卷积网络,通过回归结果对第二全卷积网络进行训练至网络收敛;将待验证图片输入第一全卷积网络,若第一全卷积网络判断在滑窗范围内存在文字,则裁剪下滑窗范围内的区域做双线性插值尺度变换并输入第二全卷积网络,通过第二全卷积网络判断区域是否为文字区域。该方法具有更好的泛化性能,并能够在保证检测准确率与召回率的同时,降低模型大小,从而提升文字检测算法性能。
-
公开(公告)号:CN112183492A
公开(公告)日:2021-01-05
申请号:CN202011222677.1
申请日:2020-11-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种人脸模型精度矫正方法、装置及存储介质,分别采用包含有第一人脸检测算法的第一人脸识别系统和包含有第二人脸检测算法的第二人脸识别系统对同一个数据集进行人脸图像提取,获取目标样本对;以人脸识别训练数据集作为训练集通过微调超参数并执行数据增强变换方案对第一人脸识别系统中的人脸特征提取模型进行训练;将第一人脸识别系统作为学生网络,经过以上步骤训练后的人脸特征提取模型为教师网络,利用目标样本对通过知识蒸馏对学生网络进行训练,知识蒸馏采用异质同源样本自蒸馏结构;将第二人脸检测算法结合经过以上步骤训练后的学生网络形成第三人脸识别系统。该方法高速、有效,简化了人脸检测算法更换后精度矫正的全流程。
-
公开(公告)号:CN112149739A
公开(公告)日:2020-12-29
申请号:CN202011019291.0
申请日:2020-09-25
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种特殊服饰检测方法、终端设备及存储介质,该方法中包括:采集包含特殊服饰的图片组成训练集;通过训练集对全卷积神经网络模型和卷积神经网络分类模型进行分别训练;获取待检测图片;根据训练后的全卷积神经网络模型对待检测图片中的特殊服饰所在区域进行初步定位;根据初步定位的特殊服饰所在区域从待检测图片中截取候选区域;通过训练后的卷积神经网络分类模型对候选区域对应的图片进行分类,得到待检测图片对应的特殊服饰的类型。本发明使用最新的人工智能技术,在不降低或极小降低速度的前提下充分提高了特殊服装的检测准确率。
-
公开(公告)号:CN111783674A
公开(公告)日:2020-10-16
申请号:CN202010628541.4
申请日:2020-07-02
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种基于AR眼镜的人脸识别方法和系统,包括在AR眼镜上部署第一人脸特征库以及用于人脸识别的第一压缩神经网络模型,并利用AR眼镜上的图像采集终端实时抓拍人脸图像;响应于AR眼镜未接入网络,利用压缩神经网络模型进行人脸图像的人脸识别;响应于AR眼镜与移动终端建立联系,将人脸图像传输至移动终端,并利用移动终端上部署的第二压缩神经网络模型进行人脸图像的人脸识别;响应于AR眼镜接入网络,将人脸图像传输至后台服务器,并利用后台服务器上部署的深度学习的神经网络模型进行人脸图像的人脸识别;在AR眼镜上示出人脸识别的匹配结果。该基于AR眼镜的人脸识别方法和系统可根据不同使用环境切换工作模式,快速完成识别工作。
-
公开(公告)号:CN107579821B
公开(公告)日:2020-04-28
申请号:CN201710851440.1
申请日:2017-09-19
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种密码字典生成方法及计算机可读存储介质,方法包括:收集密码集;生成测试集;通过递归神经网络模型对当前的密码集进行训练,得到字典模型;根据字典模型生成字典;根据测试集,得到当前的密码集的命中率;随机修改当前的密码集,得到新的密码集;通过递归神经网络模型对新的密码集进行训练,得到新的字典模型;根据新的字典模型生成新的字典;根据测试集,得到新的密码集的命中率;若新的密码集的命中率大于当前的密码集的命中率,则令更新次数加一,并将新的密码集作为当前的密码集;当更新次数达到预设的第一次数时,根据当前的密码集对应的字典模型,生成密码字典。本发明最终生成的密码字典可提高密码恢复的成功率。
-
公开(公告)号:CN110136726A
公开(公告)日:2019-08-16
申请号:CN201910539105.7
申请日:2019-06-20
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种语音性别的估计方法、装置、系统及存储介质,所述方法包括:获取待识别语音数据;对所述待识别语音数据进行特征提取,得到所述待识别语音数据的语音特征;将所述语音特征输入训练好的语音估计模型,得到所述待识别语音数据的性别估计结果。根据本发明的方法、装置、系统及存储介质,对语音数据进行特征提取后,通过建立的语音性别估计模型进行语音估计,从而实现语音背景复杂和不同语音等环境下快速准确的语音性别估计,提升用户体验。
-
公开(公告)号:CN114373097B
公开(公告)日:2024-09-27
申请号:CN202111532343.9
申请日:2021-12-15
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/088
Abstract: 本发明涉及一种基于半监督的图像分类方法、终端设备及存储介质,该方法中包括:S1:采集已标注图像组成训练集;S2:构建图像分类模型,通过训练集对图像分类模型进行训练,将训练后的模型作为初始模型;S3:采集未标注图像输入初始模型,并将初始模型输出的类别标注为各未标注图像的伪标签后,添加至训练集内;S4:在基础模型对应的分类网络之后添加高斯混合模型组成错误分类识别模型;S5:通过训练集对错误分类识别模型进行训练,基于训练后的错误分类识别模型中的分类网络构建最终分类模型;S6:通过最终分类模型对图像进行分类。本发明不仅可以得到更加准确的类标,而且提升了在带噪声样本集训练的模型的准确率。
-
公开(公告)号:CN117095329A
公开(公告)日:2023-11-21
申请号:CN202310959022.X
申请日:2023-08-01
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V20/40 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 公开了一种减缓行人属性识别类内变化的方法和系统,包括接收数据集中任一张图像xi输入主干网络进行多标签分类任务的行人属性识别,采用二值交叉熵作为损失函数;利用指数信息瓶颈作用于主干网络的每个卷积模块和注意力机制模块,过滤特征中存在的冗余干扰特征信息。本申请提出的指数信息瓶颈方法可以集成到注意力模块中,形成一个新颖的行人熟悉识别网络,可以进一步处理基于注意力机制的属性内变化,指数信息瓶颈方法是即插即用的,在推理期间没有任何额外的计算开销。
-
公开(公告)号:CN115578714A
公开(公告)日:2023-01-06
申请号:CN202211183158.8
申请日:2022-09-27
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了一种基于浅层特征信息增强的车辆颜色识别方法和系统,包括在车辆颜色识别的卷积神经网络中嵌入浅层特征信息增强模块,卷积神经网络包括浅层卷积块、中层卷积块和高层卷积块,浅层特征信息增强模块嵌入浅层卷积块和中层卷积块之后;车辆图片作为浅层卷积块的输入依次进行特征提取,浅层特征信息增强模块接收特征输入,经过多个1*1卷积层获得不同维度的特征,对不同维度的特征进行矩阵相乘获得增强信息表达的特征,送入下一卷积块;将各卷积块的特征依次送入全局平均池化层、对应的分类层进行分类,并利用标签平滑正则化的交叉熵损失函数进行约束。浅层特征信息增强模块可灵活的插入卷积神经网络任意位置,增强特征信息,增加模型的泛化性。
-
公开(公告)号:CN115546907A
公开(公告)日:2022-12-30
申请号:CN202211153579.6
申请日:2022-09-21
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 公开了多尺度特征聚合的活体检测方法和系统,包括将RGB图像通过图像变换转换为HSV图像,将RGB图像和HSV图像融合为RGB‑HSV图像并送入主干网络;将主干网络提取的特征送入特征深度拓展模块,并将输出送入多特征提取模块以获得更多的上下文信息;将最终输出经过池化层和分类层,并在交叉熵损失函数的约束下进行训练。本发明提出的一种多尺度特征聚合的活体检测方法和系统,其具有参数量小、对图像的接受域大、多尺度特征聚合的特点,利用了空洞卷积以扩大网络的感受野,获取更多的上下文信息,利用RGB图像和HSV图像作为6通道的图像作为输入,运行速度与仅使用RGB图像的运行速度是一致的,在性能和效率之间取得了很好的平衡。
-
-
-
-
-
-
-
-
-