-
公开(公告)号:CN114372169A
公开(公告)日:2022-04-19
申请号:CN202111485056.7
申请日:2021-12-07
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/583 , G06V20/40 , G06K9/62 , G06V10/74
Abstract: 本发明公开了一种同源视频检索方法、装置以及存储介质。所述方法包括:对所述视频库中的所有视频进行处理,确定出各视频的视频特征序列;对所述待检索视频进行处理,确定出待检索视频的视频特征序列;基于所述待检索视频的视频特征序列在视频库中查找,若在视频库中找到某一段视频与待检索视频的视频特征序列的相似度达到预定条件,则表明检索到所述待检索视频,否则未检索到所述待检索视频。本发明提供的一种同源视频检索方法和装置,能够实现对同源视频的高精度检索,对经过主流的视频编辑、特效渲染、复合转码等方法生成的同源视频能保持较高的检索精确度。
-
公开(公告)号:CN114219980A
公开(公告)日:2022-03-22
申请号:CN202111491247.4
申请日:2021-12-08
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V10/80 , G06V10/26 , G06V10/764 , G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08 , G06K9/62
Abstract: 本发明提出了一种基于多尺度的车型识别算法,包括:S1、将原图输入至ResNet50网络中进行卷积池化,对输出的特征信息进行广义均值池化,得到全局特征信息;S2、对所述原图进行移除背景处理,得到二值化掩膜,将所述二值化掩膜与所述原图相乘得到前景图像;S3、将所述前景图像输入至所述ResNet50网络的第一个残差卷积块,并将输出的特征信息输入至HRNet网络中,对所述HRNet网络输出的特征信息进行广义均值池化,得到多尺度特征信息;S4、对所述全局特征信息和所述多尺度特征信息进行级联得到级联特征,将所述级联特征输入至BN层和分类层,并利用三元组损失函数和交叉熵损失函数进行分类训练,从而识别车型。本发明具体提高车型识别精度的效果。
-
公开(公告)号:CN113920296A
公开(公告)日:2022-01-11
申请号:CN202111395021.4
申请日:2021-11-23
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种基于对比学习的文本识别方法与系统,包括无标签的文本图像样本,对其中每个样本进行数据增强输入卷积网络进行识别训练生成识别模型,再基于所述识别模型构建基本编码器来计算并输出特征序列;将所述特征序列输入实例映射函数生成对应的实例再映射为多个子实例,将所有的子实例作为对比损失函数中的子元素进行对比学习,将结果反馈到所述卷积网络用于更新所述卷积网络;获取包含文本信息的有标签的文本图像样本输入所述基本编码器,对所述卷积网络的参数进行调节直到所述识别模型收敛。本方法将对比学习应用于序列的各个元素,充分利用无标注数据学习有效的表征信息,再基于自监督对比学习的方法进行建模,显著提高了识别效果。
-
公开(公告)号:CN113822328A
公开(公告)日:2021-12-21
申请号:CN202110894433.6
申请日:2021-08-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及防御对抗样本攻击的图像分类方法、终端设备及存储介质,该方法中包括:S1:采集原始图像和其对应的对抗样本;S2:构建图像分类模型,图像分类模型采用深度神经网络结构,并在深度神经网络中添加去噪模块,去噪模块包括非局部均值模块和自注意力机制模块;S3:将原始图片和对应的对抗样本混合后对图像分类模型进行训练;S4:采用训练后的图像分类模型对图像进行分类。本发明通过端到端的方式在卷积网络的中间层添加去噪模块来降低对抗图像的噪声扰动,去噪模块由非局部均值模块和自注意力机制模块相结合,能够达到去噪目的且能够与任意卷积层相衔接,从而提高模型的对抗鲁棒性,有效解决了对抗样本攻击深度学习系统存在的隐患。
-
公开(公告)号:CN113807392A
公开(公告)日:2021-12-17
申请号:CN202110896904.7
申请日:2021-08-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种基于多预处理特征融合的篡改图像鉴别方法,其可包括以下步骤:S1、收集样本,构建训练集与验证集;S2、搭建多预处理特征提取模块;S3、将训练集中的每一张图像通过多预处理特征提取模块处理得到相应特征,并对同一张图像获取到的特征以通道维度合并,形成该图像的特征张量;S4、将特征张量输入神经网络模型进行训练直到损失收敛;S5、将验证集输入训练好的神经网络模型,获取输出结果,若输出结果大于预设阈值,则判定该图像为篡改图像。本发明通过提前提取先验特征的方式,使得模型更容易拟合到相关特征,更易于训练,能够实现对多种篡改方式进行同时鉴别。
-
公开(公告)号:CN112418405A
公开(公告)日:2021-02-26
申请号:CN202011412659.X
申请日:2020-12-03
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请实施例公开了模型压缩方法和装置。该方法的一具体实施方式包括:对于预设的样本图像集合中的每个样本图像,将该样本图像输入预设的基础图像识别模型,得到至少一个目标层分别对应的通道集合;基于通道集合,确定每个目标层分别对应的初始通道重要度向量;基于初始通道重要度向量,确定每个目标层分别对应的通道重要度向量;对于至少一个目标层中的每个目标层,基于该目标层对应的通道重要度向量,从该目标层中确定非重要通道并删除;将删除非重要通道后的模型作为子模型并对子模型进行训练。该实施方式实现了在不影响图像识别精度的情况下,对模型的体积进行有效的压缩,从而有助于节约模型占用的存储空间,并提高模型处理数据的效率。
-
公开(公告)号:CN112381775A
公开(公告)日:2021-02-19
申请号:CN202011230556.1
申请日:2020-11-06
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及一种图像篡改检测方法、终端设备及存储介质,该方法中包括:S1:采集未篡改图像和对应的篡改图像,并将未篡改图像减去篡改图像得到篡改图像的差异图像,将未篡改图像和篡改图像共同组成训练集;S2:构建二分类网络模型,通过训练集对二分类网络模型进行训练,使得训练后的二分类网络模型能够区分图像是否被篡改;二分类网络模型包括特征提取层、图像注意力层和分类器;S3:通过训练后的二分类网络模型对图像是否被篡改进行识别。本发明将差异图像作为真实标签。以真实标签作为篡改监督信息,使用神经网络训练二值分类网络,引导网络获取准确的篡改检测概率值和伪造定位图,可以有效提升人脸篡改图像识别分类的性能。
-
公开(公告)号:CN111985483A
公开(公告)日:2020-11-24
申请号:CN202010761222.0
申请日:2020-07-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提出了一种拍屏文件图片检测方法、装置及存储介质,该方法包括:拍照设备中获取待检测的图片;使用第一卷积神经网络模型对所述待检测的图片进行检测,如果该图片为拍屏图片,则使用第二卷积神经网络检测该图片中是否包含文字,如果是,则进行文字识别;使用第三卷积神经网络模型对包含文字的拍屏图片进行文字识别,得到文本文件;使用所述文本文件与计算机系统中存储的文件进行匹配,如果匹配度大于第一阈值,则发出警报。本发明考虑到硬件的限制,设计了速度较快且准确率较好的图片分类模型,改进基于卷积神经网络的文字检测和文本识别算法,提升了文字检测和文本识别的速度,解决了拍屏文件图片检测和文本识别问题,可应用于低端手持设备,提升了用户体验。
-
公开(公告)号:CN111160220A
公开(公告)日:2020-05-15
申请号:CN201911368237.4
申请日:2019-12-26
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种基于深度学习的包裹检测方法、装置及存储介质,该方法包括:获取视频源中的一帧图像;使用训练后的深度神经网络模型检测所述图像中是否存在包裹,如果是,则计算包裹的尺寸;如果所述包裹的尺寸超过第一阈值,则将该包裹标记为大件包裹,否则进行行人检测;如果所述距离大于第二阈值,则将所述包裹标记为无主包裹;如果存在大件包裹或无主包裹则发出警报。即本发明使用与传统背景建模完全不同的技术,不需要区分前景和背景,因此可用于机器人移动场景下的包裹检测,使得机场的包裹检测不留死角,且不需要安装大量的摄像头,节约了成本。
-
公开(公告)号:CN108629333A
公开(公告)日:2018-10-09
申请号:CN201810516307.5
申请日:2018-05-25
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提供了一种低照度的人脸图像处理方法、装置、设备及可读介质,该方法包括:对视频中的每一帧进行处理,提取出属于同一个人的n张二维人脸图像;然后将n张二维人脸图像根据三维人脸模型生成n张三维人脸图像,并将n张三维人脸图像叠加生成一张均值三维人脸图像;再将均值三维人脸图像映射至二维空间得到一张均值二维人脸图像;对均值二维人脸图像做图像增强处理后获得合适的亮度和对比的人脸图像。本发明根据热噪声的特点对视频中帧图像噪声进行降噪处理,并获取二维人脸图像后转成三维图像后进行叠加计算,以此来提高人脸照片的信噪比,并能通过所有二维人脸图像中不同角度的人脸照片不断补全人脸被遮挡部分的纹理,提高人脸图像的质量。
-
-
-
-
-
-
-
-
-