-
公开(公告)号:CN114049513A
公开(公告)日:2022-02-15
申请号:CN202111120541.4
申请日:2021-09-24
Applicant: 中国科学院信息工程研究所
IPC: G06V10/764 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于多学生讨论的知识蒸馏方法和系统。该方法的步骤包括:1)选取复杂网络ResNet32x4作为知识蒸馏的教师模型,对教师模型进行预训练;2)进行知识蒸馏,采用单老师多学生的蒸馏模式,多个小型学生网络的参数分别初始化并独立训练,分别学习来自教师网络的知识;3)借助讨论模块使得学生网络相互讨论,以各个学生模型的logits输出作为其输入,采用多层卷积神经网络,将各个学生网络的输出耦合在一起,输出最终的类别预测;4)将待分类的图像输入学生网络,再经过学生之间的讨论得到最终的图像分类结果。本发明大大提高了图像分类的准确率,并改善了知识蒸馏领域中师生模型表达能力差异较大的情况。
-
公开(公告)号:CN113963165A
公开(公告)日:2022-01-21
申请号:CN202111098484.4
申请日:2021-09-18
Applicant: 中国科学院信息工程研究所
IPC: G06V10/40 , G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/08
Abstract: 本发明公开一种基于自监督学习的小样本图像分类方法及系统,属于计算机视觉技术领域,通过自监督学习、对比学习、共同学习等方法,在数据集的所有训练数据上训练一个具有泛化性能的特征提取器。本把自监督学习应用到小样本学习的训练中,提高小样本学习中特征提取器的表示能力;把对比学习应用到小样本学习中,同时对度量函数进行优化,让特征提取器学习的特征具有更显著的分类边界;把共同学习应用到小样本学习的训练中,从而引入正则化约束,提高网络的泛化性能。
-
公开(公告)号:CN112257766A
公开(公告)日:2021-01-22
申请号:CN202011109331.0
申请日:2020-10-16
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于频域滤波处理的自然场景下阴影识别检测方法,其步骤包括:1)频域选择模块对数据集中的图片进行处理,为对应图片构造频域范围内的人工特征低频图;所述数据集包含多个图片及其二值掩模图;2)基于UNet网络构造阴影检测网络,所述阴影检测网络的损失函数包含用于计算生成图片与对应二值掩膜图的相似度的Dice损失函数;3)利用各图片及其对应的人工特征低频图、二值掩膜图对所述阴影检测网络进行训练;4)将待检测图片输入训练后的阴影检测网络,检测得到该待检测图片的阴影。本发明大大提高了阴影检测的准确性。
-
公开(公告)号:CN109635808A
公开(公告)日:2019-04-16
申请号:CN201811294643.6
申请日:2018-11-01
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/344 , G06K9/6256 , G06K9/6268 , G06K2209/01
Abstract: 本发明公开一种在自然场景图像中对中文关键词及上下文的提取方法,步骤包括:准备一个合适的中文数据集及物体检测分类模型,调整现有标注,对中文逐一文字进行标注;对图片进行中文文字检测,基于物体检测分类模型,将中文文字作为不同类别进行检测分类将;通过计算自定义的匹配系数,从物体检测分类结果中提取关键词,通过不断更新锚点关键词和生成候选直线的方式提取上下文信息。本发明在中文文字关键词及上下文识别上有高精度高召回的效果。
-
公开(公告)号:CN109214394A
公开(公告)日:2019-01-15
申请号:CN201810871572.5
申请日:2018-08-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于颜色和纹理特性的风格迁移伪造图像检测方法和装置。该方法首先构建训练图像集的颜色统计分布图和训练图像集中所有训练图像的颜色统计分布图,然后根据差异最大化原则计算颜色检测特征参数,基于颜色检测特征参数计算每幅训练图像的颜色统计分布图的部分检测特征,计算每幅训练图像的颜色统计分布图的分布特性,提取每幅训练图像的纹理特征从而计算其纹理统计特性,从而构建完整的检测特征,最后利用训练图像的完整检测特征和对应的训练图像标签训练检测分类器。针对待检测图像提取其完整检测特征并利用训练好的检测分类器进行检测。本发明为风格迁移伪造图像地检测提供了有效的解决办法,也为伪造图像检测领域填补了空白。
-
公开(公告)号:CN108960229A
公开(公告)日:2018-12-07
申请号:CN201810366383.2
申请日:2018-04-23
Applicant: 中国科学院信息工程研究所
CPC classification number: G06K9/3233 , G06K9/3275 , G06K9/342
Abstract: 本发明涉及一种面向多方向的文字检测方法和装置。在训练方面,在不改变网络结构的基础上,对四边形真值框进行切分,把四边形真值框变为多个矩形区域的条状真值框,满足CTPN的输入,控制一个训练的最小批量正负样本比例,保证正负样本平衡,再放入CTPN网络进行训练;在测试方面,同时对原图和旋转90度之后的图片放入测试网络,对网络预测出来的条状矩形区域进行拟合形成四边形候选框,对旋转90度的测试图片的检测结果进行逆时针旋转90度恢复为原图的坐标位置;最后对两图的检测结果综合做非极大值抑制等筛选,实现准确的多方向文字定位。本发明能够适应多方向,包括水平、倾斜、竖直等方向的文字,并且有着较高的精度。
-
公开(公告)号:CN105589807B
公开(公告)日:2018-05-11
申请号:CN201510964190.3
申请日:2015-12-21
Applicant: 中国科学院信息工程研究所
IPC: G06F11/36
Abstract: 本发明涉及一种应用程序间组件能力泄露动态检测方法和系统。该方法包括:1)设置Android应用程序的调用链初始信息;2)扩展Android Binder通信机制,在不同进程之间传递线程级调用链并对其进行扩展;3)扩展组件间通信监控机制,捕获组件间通信信息,并根据线程级调用链获取组件级调用链;4)根据组件调用链追踪Android的跨应用程序通信,在执行敏感操作时,获取当前线程的线程级调用链及组件级调用链,并根据调用链分析组件间通信是否发生组件能力泄露。本发明能够检测跨应用程序通信中存在的组件能力泄露问题,并通过对权限机制进行加强阻止跨应用程序导致的组件通信能力泄露。
-
公开(公告)号:CN104837031B
公开(公告)日:2018-01-30
申请号:CN201510163392.8
申请日:2015-04-08
Applicant: 中国科学院信息工程研究所
IPC: H04N21/234 , H04N21/44
Abstract: 本发明公开了一种高速自适应提取视频关键帧的方法。本方法为:1)对于每一待处理的视频文件,解析该视频文件提取出类型为KEY_FRAME数据帧;2)根据实际需求,选取一所提取的类型为KEY_FRAME数据帧作为该视频文件的第一个关键帧存储到关键帧数据库中;然后计算后续提取的类型为KEY_FRAME的数据帧与该关键帧数据库中该视频文件的前一关键帧的相似度,如果相似度小于或等于设定阈值,则将该类型为KEY_FRAME的数据帧作为该视频文件的关键帧存储到该关键帧数据库中;否则,丢弃所提取的类型为KEY_FRAME的数据帧。本发明大大提高了关键帧的提取速度。
-
公开(公告)号:CN104008329B
公开(公告)日:2017-02-15
申请号:CN201410218719.2
申请日:2014-05-22
Applicant: 中国科学院信息工程研究所
IPC: G06F21/53
Abstract: 本发明涉及一种基于虚拟化技术的软件隐私泄露行为检测方法及系统。该方法将待分析的软件加载到修改后的虚拟机中运行;然后在软件执行过程中,监控每一条指令的执行,当应用程序访问敏感资源时,标记相关污点数据并制定相关污点传播规则,在此基础上,动态生成指令级污点依赖图,并根据系统重构翻译,动态生成系统进程级污点依赖图;通过细粒度污点依赖分析图,分析软件的隐私泄露行为。本发明采用指令级和进程级相结合的多级动态污点分析方法,获得细粒度的污点依赖分析图,从而可以获得系统污染的路径信息,以及信息泄露等高层次语义信息,实现软件隐私泄露行为的有效分析和检测。
-
公开(公告)号:CN105812832A
公开(公告)日:2016-07-27
申请号:CN201610203951.8
申请日:2016-04-01
Applicant: 中国科学院信息工程研究所
IPC: H04N21/231 , H04N21/234 , H04N21/472 , H04N21/4722 , H04N21/475 , H04N21/647
CPC classification number: H04N21/231 , H04N21/23418 , H04N21/47205 , H04N21/4722 , H04N21/475 , H04N21/647
Abstract: 本发明涉及一种基于安卓多媒体框架的视频类App中视频数据获取方法。该方法根据视频解码播放流程跟踪Android源码中多媒体数据的流向,定位Acodec框架中视频分离后通过OMXCodec接口进入解码器的位置,从该位置获取H264视频数据;然后跟踪H264数据经过解码器解码后的视频数据,定位其送至图形显示框架ANativeWindow的位置从而获取视频的YUV数据,并根据需求选择是否压缩YUV数据为Jpeg数据。本发明基于Android源码或者CyanogenMod源码,能够处理基于Android多媒体框架的所有App以获取视频数据,视频数据的获取可以达到零延时。
-
-
-
-
-
-
-
-
-