-
公开(公告)号:CN111985483B
公开(公告)日:2022-08-26
申请号:CN202010761222.0
申请日:2020-07-31
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明提出了一种拍屏文件图片检测方法、装置及存储介质,该方法包括:拍照设备中获取待检测的图片;使用第一卷积神经网络模型对所述待检测的图片进行检测,如果该图片为拍屏图片,则使用第二卷积神经网络检测该图片中是否包含文字,如果是,则进行文字识别;使用第三卷积神经网络模型对包含文字的拍屏图片进行文字识别,得到文本文件;使用所述文本文件与计算机系统中存储的文件进行匹配,如果匹配度大于第一阈值,则发出警报。本发明考虑到硬件的限制,设计了速度较快且准确率较好的图片分类模型,改进基于卷积神经网络的文字检测和文本识别算法,提升了文字检测和文本识别的速度,解决了拍屏文件图片检测和文本识别问题,可应用于低端手持设备,提升了用户体验。
-
公开(公告)号:CN112418405B
公开(公告)日:2022-08-19
申请号:CN202011412659.X
申请日:2020-12-03
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请实施例公开了模型压缩方法和装置。该方法的一具体实施方式包括:对于预设的样本图像集合中的每个样本图像,将该样本图像输入预设的基础图像识别模型,得到至少一个目标层分别对应的通道集合;基于通道集合,确定每个目标层分别对应的初始通道重要度向量;基于初始通道重要度向量,确定每个目标层分别对应的通道重要度向量;对于至少一个目标层中的每个目标层,基于该目标层对应的通道重要度向量,从该目标层中确定非重要通道并删除;将删除非重要通道后的模型作为子模型并对子模型进行训练。该实施方式实现了在不影响图像识别精度的情况下,对模型的体积进行有效的压缩,从而有助于节约模型占用的存储空间,并提高模型处理数据的效率。
-
公开(公告)号:CN114882593A
公开(公告)日:2022-08-09
申请号:CN202210551600.1
申请日:2022-05-18
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明给出了一种鲁棒的时空混合步态特征学习方法和系统,包括对于输入的一组步态帧序列,将每一帧的人体分割为易受着装变化影响的部分和不易受着装变化影响的部分,不易受着装变化影响的部分包括头部和小腿部分;对不易受着装变化影响的部分,通过三个不同子网络分别提取步态特征,将提取到的三个步态特征级联,作为最终进行步态识别的步态特征,三个不同子网络包括局部空间特征提取网络、全局空间特征提取网络和连续短时间间隔内的步态动态特征提取网络。每个子网络都刻画了步态特征的不同方面,串联混合可以合成一个更为鲁棒的步态特征,该方法和系统在处理行人着装变化这一步态识别问题时具有显著的增益效果。
-
公开(公告)号:CN114764451A
公开(公告)日:2022-07-19
申请号:CN202210551524.4
申请日:2022-05-18
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/583 , G06F16/58 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/82
Abstract: 本发明给出了一种消除模态差异的跨模态检索方法和系统,包括将RGB图像和IR图像随机打乱,选取训练批作为输入;引入中间模态数据,利用中间模态数据结合动态稀疏规范化伪标签策略以增强模型泛化性。本发明提出了一种渐进式的消除模态差异的跨模态目标检索算法,将模型的关注点集中于图像本身,而不是图像对之间的ID关联。紧接着引入中间模态的数据,进一步防止IR图像信息在训练过程中被忽略,中间模态数据集由非条件生成对抗网络生成,并采用动态稀疏规范化伪标签策略来为中间模态数据集生成标签,可用于跨模态人脸检索和行人检索,该方法和系统在跨模态目标检索上有显著的性能提升。
-
公开(公告)号:CN115147908B
公开(公告)日:2025-05-06
申请号:CN202210879588.7
申请日:2022-07-25
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V40/16 , G06V40/40 , G06V10/74 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/08
Abstract: 本申请提出了一种基于图像patch序损失的人脸鉴伪方法,包括:S1、获取包含训练图像及其标签信息的人像鉴伪数据集;S2、对所述人像鉴伪数据集进行数据处理,包括:对所述训练图像进行均匀切割并打乱所述训练图像的初始patch序列集合,得到所述训练图像的第一patch序列集合;对所述第一patch序列集合进行增强处理,得到第二patch序列集合;将不同所述训练图像的所述第一patch序列集合和所述第二patch序列集合中的patch块进行随机交换,从而得到处理后的人像鉴伪数据集;S3、利用所述处理后的人像鉴伪数据集训练得到神经网络分类模型;S4、将待检测图像输入到所述神经网络分类模型中。本申请的人像鉴伪方法极大的节约了训练成本和数据收集成本,并且具有较高的判别准确性。
-
公开(公告)号:CN114445851B
公开(公告)日:2024-09-24
申请号:CN202111533341.1
申请日:2021-12-15
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06V40/10 , G06V20/40 , G06N3/0464 , G06V10/82 , G06V10/46 , G06V10/774
Abstract: 本发明涉及基于视频的谈话场景异常检测方法、终端设备及存储介质,该方法中包括:S1:提取谈话人画面图像、被谈话人画面图像和全景画面图像;S2:检测全景画面图像中人数,并判断其与实际总人数的大小关系,如果大于,则发送围观异常的提醒;如果小于,则进入S3进行人员是否离位判断;如果等于,则进入S4进行人员是否肢体接触的判断。本发明可以对谈话视频中出现的人员离位、人员围观、人员接触等不合规行为进行检测,达到相对智能化的谈话视频违规检测的目的。
-
公开(公告)号:CN112183492B
公开(公告)日:2022-07-15
申请号:CN202011222677.1
申请日:2020-11-05
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明公开了一种人脸模型精度矫正方法、装置及存储介质,分别采用包含有第一人脸检测算法的第一人脸识别系统和包含有第二人脸检测算法的第二人脸识别系统对同一个数据集进行人脸图像提取,获取目标样本对;以人脸识别训练数据集作为训练集通过微调超参数并执行数据增强变换方案对第一人脸识别系统中的人脸特征提取模型进行训练;将第一人脸识别系统作为学生网络,经过以上步骤训练后的人脸特征提取模型为教师网络,利用目标样本对通过知识蒸馏对学生网络进行训练,知识蒸馏采用异质同源样本自蒸馏结构;将第二人脸检测算法结合经过以上步骤训练后的学生网络形成第三人脸识别系统。该方法高速、有效,简化了人脸检测算法更换后精度矫正的全流程。
-
公开(公告)号:CN114445851A
公开(公告)日:2022-05-06
申请号:CN202111533341.1
申请日:2021-12-15
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本发明涉及基于视频的谈话场景异常检测方法、终端设备及存储介质,该方法中包括:S1:提取谈话人画面图像、被谈话人画面图像和全景画面图像;S2:检测全景画面图像中人数,并判断其与实际总人数的大小关系,如果大于,则发送围观异常的提醒;如果小于,则进入S3进行人员是否离位判断;如果等于,则进入S4进行人员是否肢体接触的判断。本发明可以对谈话视频中出现的人员离位、人员围观、人员接触等不合规行为进行检测,达到相对智能化的谈话视频违规检测的目的。
-
公开(公告)号:CN114372169A
公开(公告)日:2022-04-19
申请号:CN202111485056.7
申请日:2021-12-07
Applicant: 厦门市美亚柏科信息股份有限公司
IPC: G06F16/583 , G06V20/40 , G06K9/62 , G06V10/74
Abstract: 本发明公开了一种同源视频检索方法、装置以及存储介质。所述方法包括:对所述视频库中的所有视频进行处理,确定出各视频的视频特征序列;对所述待检索视频进行处理,确定出待检索视频的视频特征序列;基于所述待检索视频的视频特征序列在视频库中查找,若在视频库中找到某一段视频与待检索视频的视频特征序列的相似度达到预定条件,则表明检索到所述待检索视频,否则未检索到所述待检索视频。本发明提供的一种同源视频检索方法和装置,能够实现对同源视频的高精度检索,对经过主流的视频编辑、特效渲染、复合转码等方法生成的同源视频能保持较高的检索精确度。
-
公开(公告)号:CN112418405A
公开(公告)日:2021-02-26
申请号:CN202011412659.X
申请日:2020-12-03
Applicant: 厦门市美亚柏科信息股份有限公司
Abstract: 本申请实施例公开了模型压缩方法和装置。该方法的一具体实施方式包括:对于预设的样本图像集合中的每个样本图像,将该样本图像输入预设的基础图像识别模型,得到至少一个目标层分别对应的通道集合;基于通道集合,确定每个目标层分别对应的初始通道重要度向量;基于初始通道重要度向量,确定每个目标层分别对应的通道重要度向量;对于至少一个目标层中的每个目标层,基于该目标层对应的通道重要度向量,从该目标层中确定非重要通道并删除;将删除非重要通道后的模型作为子模型并对子模型进行训练。该实施方式实现了在不影响图像识别精度的情况下,对模型的体积进行有效的压缩,从而有助于节约模型占用的存储空间,并提高模型处理数据的效率。
-
-
-
-
-
-
-
-
-