一种拍屏文件图片检测方法、装置及存储介质

    公开(公告)号:CN111985483B

    公开(公告)日:2022-08-26

    申请号:CN202010761222.0

    申请日:2020-07-31

    Abstract: 本发明提出了一种拍屏文件图片检测方法、装置及存储介质,该方法包括:拍照设备中获取待检测的图片;使用第一卷积神经网络模型对所述待检测的图片进行检测,如果该图片为拍屏图片,则使用第二卷积神经网络检测该图片中是否包含文字,如果是,则进行文字识别;使用第三卷积神经网络模型对包含文字的拍屏图片进行文字识别,得到文本文件;使用所述文本文件与计算机系统中存储的文件进行匹配,如果匹配度大于第一阈值,则发出警报。本发明考虑到硬件的限制,设计了速度较快且准确率较好的图片分类模型,改进基于卷积神经网络的文字检测和文本识别算法,提升了文字检测和文本识别的速度,解决了拍屏文件图片检测和文本识别问题,可应用于低端手持设备,提升了用户体验。

    模型压缩方法和装置
    22.
    发明授权

    公开(公告)号:CN112418405B

    公开(公告)日:2022-08-19

    申请号:CN202011412659.X

    申请日:2020-12-03

    Abstract: 本申请实施例公开了模型压缩方法和装置。该方法的一具体实施方式包括:对于预设的样本图像集合中的每个样本图像,将该样本图像输入预设的基础图像识别模型,得到至少一个目标层分别对应的通道集合;基于通道集合,确定每个目标层分别对应的初始通道重要度向量;基于初始通道重要度向量,确定每个目标层分别对应的通道重要度向量;对于至少一个目标层中的每个目标层,基于该目标层对应的通道重要度向量,从该目标层中确定非重要通道并删除;将删除非重要通道后的模型作为子模型并对子模型进行训练。该实施方式实现了在不影响图像识别精度的情况下,对模型的体积进行有效的压缩,从而有助于节约模型占用的存储空间,并提高模型处理数据的效率。

    一种消除模态差异的跨模态检索方法和系统

    公开(公告)号:CN114764451A

    公开(公告)日:2022-07-19

    申请号:CN202210551524.4

    申请日:2022-05-18

    Abstract: 本发明给出了一种消除模态差异的跨模态检索方法和系统,包括将RGB图像和IR图像随机打乱,选取训练批作为输入;引入中间模态数据,利用中间模态数据结合动态稀疏规范化伪标签策略以增强模型泛化性。本发明提出了一种渐进式的消除模态差异的跨模态目标检索算法,将模型的关注点集中于图像本身,而不是图像对之间的ID关联。紧接着引入中间模态的数据,进一步防止IR图像信息在训练过程中被忽略,中间模态数据集由非条件生成对抗网络生成,并采用动态稀疏规范化伪标签策略来为中间模态数据集生成标签,可用于跨模态人脸检索和行人检索,该方法和系统在跨模态目标检索上有显著的性能提升。

    一种基于图像patch序损失的人脸鉴伪方法、系统及介质

    公开(公告)号:CN115147908B

    公开(公告)日:2025-05-06

    申请号:CN202210879588.7

    申请日:2022-07-25

    Abstract: 本申请提出了一种基于图像patch序损失的人脸鉴伪方法,包括:S1、获取包含训练图像及其标签信息的人像鉴伪数据集;S2、对所述人像鉴伪数据集进行数据处理,包括:对所述训练图像进行均匀切割并打乱所述训练图像的初始patch序列集合,得到所述训练图像的第一patch序列集合;对所述第一patch序列集合进行增强处理,得到第二patch序列集合;将不同所述训练图像的所述第一patch序列集合和所述第二patch序列集合中的patch块进行随机交换,从而得到处理后的人像鉴伪数据集;S3、利用所述处理后的人像鉴伪数据集训练得到神经网络分类模型;S4、将待检测图像输入到所述神经网络分类模型中。本申请的人像鉴伪方法极大的节约了训练成本和数据收集成本,并且具有较高的判别准确性。

    一种人脸模型精度矫正方法、装置及存储介质

    公开(公告)号:CN112183492B

    公开(公告)日:2022-07-15

    申请号:CN202011222677.1

    申请日:2020-11-05

    Abstract: 本发明公开了一种人脸模型精度矫正方法、装置及存储介质,分别采用包含有第一人脸检测算法的第一人脸识别系统和包含有第二人脸检测算法的第二人脸识别系统对同一个数据集进行人脸图像提取,获取目标样本对;以人脸识别训练数据集作为训练集通过微调超参数并执行数据增强变换方案对第一人脸识别系统中的人脸特征提取模型进行训练;将第一人脸识别系统作为学生网络,经过以上步骤训练后的人脸特征提取模型为教师网络,利用目标样本对通过知识蒸馏对学生网络进行训练,知识蒸馏采用异质同源样本自蒸馏结构;将第二人脸检测算法结合经过以上步骤训练后的学生网络形成第三人脸识别系统。该方法高速、有效,简化了人脸检测算法更换后精度矫正的全流程。

    一种同源视频检索的方法、装置以及存储介质

    公开(公告)号:CN114372169A

    公开(公告)日:2022-04-19

    申请号:CN202111485056.7

    申请日:2021-12-07

    Abstract: 本发明公开了一种同源视频检索方法、装置以及存储介质。所述方法包括:对所述视频库中的所有视频进行处理,确定出各视频的视频特征序列;对所述待检索视频进行处理,确定出待检索视频的视频特征序列;基于所述待检索视频的视频特征序列在视频库中查找,若在视频库中找到某一段视频与待检索视频的视频特征序列的相似度达到预定条件,则表明检索到所述待检索视频,否则未检索到所述待检索视频。本发明提供的一种同源视频检索方法和装置,能够实现对同源视频的高精度检索,对经过主流的视频编辑、特效渲染、复合转码等方法生成的同源视频能保持较高的检索精确度。

    模型压缩方法和装置
    30.
    发明公开

    公开(公告)号:CN112418405A

    公开(公告)日:2021-02-26

    申请号:CN202011412659.X

    申请日:2020-12-03

    Abstract: 本申请实施例公开了模型压缩方法和装置。该方法的一具体实施方式包括:对于预设的样本图像集合中的每个样本图像,将该样本图像输入预设的基础图像识别模型,得到至少一个目标层分别对应的通道集合;基于通道集合,确定每个目标层分别对应的初始通道重要度向量;基于初始通道重要度向量,确定每个目标层分别对应的通道重要度向量;对于至少一个目标层中的每个目标层,基于该目标层对应的通道重要度向量,从该目标层中确定非重要通道并删除;将删除非重要通道后的模型作为子模型并对子模型进行训练。该实施方式实现了在不影响图像识别精度的情况下,对模型的体积进行有效的压缩,从而有助于节约模型占用的存储空间,并提高模型处理数据的效率。

Patent Agency Ranking