-
公开(公告)号:CN101520848A
公开(公告)日:2009-09-02
申请号:CN200810100949.3
申请日:2008-02-27
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开了一种图像型垃圾邮件的过滤方法,包括:收集图像型垃圾邮件样本,建立图像型垃圾邮件训练集;从该训练集中提取训练集图像的傅立叶-梅林不变量特征作为图像的底层特征;对该傅立叶-梅林不变量特征进行分析降维,得到用于分类的低维特征向量;采用该低维特征向量训练分类器模型,采用该分类器模型对新邮件样本进行分类。利用本发明,大大减轻了正常电子邮件用户受到垃圾邮件骚扰的危害。
-
公开(公告)号:CN101470730A
公开(公告)日:2009-07-01
申请号:CN200710304207.8
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于频谱特征分析的图像重复检测方法,包括:通过下采样模块对图像进行下采样,通过频谱分析模块对图像进行频谱分析;用于提取图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征,该特征具有旋转、平移以及尺度不变的性质;通过索引生成模块融合图像颜色和梯度信息,作为图像索引。采用这种方法可以极大地减少数据库的存储冗余度,提高了现有检索系统的检索性能和效率。
-
公开(公告)号:CN101763502B
公开(公告)日:2012-07-25
申请号:CN200810240942.1
申请日:2008-12-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种高效的敏感图像的检测方法及其系统,包括:收集敏感图像样本和正常图像样本建立训练集并提取兴趣点,结合肤色模型对兴趣点进行过滤,去掉或保留与肤色无关或相关的兴趣点,提取兴趣点处的局部不变量特征并进行聚类,建立数据驱动的树形金字塔模型,在此基础上针对每一幅图像提取多分辨率直方图特征;采用金字塔匹配算法计算任意两幅图像的相似度,并生成核函数矩阵;利用得到的核函数矩阵对支持向量机分类器进行训练,得到分类器参数,并对新图像样本进行检测,判定其是否为敏感图像。本发明可以高效的对互联网上的敏感图像进行检测并过滤,使广大青少年在享受互联网所带来的便利同时免受不良信息的毒害。
-
公开(公告)号:CN101470731B
公开(公告)日:2012-06-20
申请号:CN200710304224.1
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明一种可个性化定制的网页过滤方法,包括步骤:用户实例网页和训练网页库特征提取;基于半监督学习的用户兴趣类属性挖掘;用户兴趣类的特征提取和特征选择;基于贝叶斯分类器的个性化网页过滤。本发明提出了一种新型的实例驱动的网页过滤框架,用户的过滤需求通过网页实例来表达,用户实例可以是任何类型或者多类型复合的网页,并借助半监督学习构造出符合用户个性化需求的网页过滤器,克服了传统网页过滤方法仅限于过滤单一或有限类型网页,难以实现个性化定制的缺点。本发明并具有高精确度、鲁棒性和运行速度的优点,具有很好的应用前景。
-
公开(公告)号:CN101470730B
公开(公告)日:2010-12-22
申请号:CN200710304207.8
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
Abstract: 本发明是一种基于频谱特征分析的图像重复检测方法,包括:通过下采样模块对图像进行下采样,通过频谱分析模块对图像进行频谱分析;用于提取图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征,该特征具有旋转、平移以及尺度不变的性质;通过索引生成模块融合图像颜色和梯度信息,作为图像索引。采用这种方法可以极大地减少数据库的存储冗余度,提高了现有检索系统的检索性能和效率。
-
公开(公告)号:CN101763502A
公开(公告)日:2010-06-30
申请号:CN200810240942.1
申请日:2008-12-24
Applicant: 中国科学院自动化研究所
Abstract: 本发明公开一种高效的敏感图像的检测方法及其系统,包括:收集敏感图像样本和正常图像样本建立训练集并提取兴趣点,结合肤色模型对兴趣点进行过滤,去掉或保留与肤色无关或相关的兴趣点,提取兴趣点处的局部不变量特征并进行聚类,建立数据驱动的树形金字塔模型,在此基础上针对每一幅图像提取多分辨率直方图特征;采用金字塔匹配算法计算任意两幅图像的相似度,并生成核函数矩阵;利用得到的核函数矩阵对支持向量机分类器进行训练,得到分类器参数,并对新图像样本进行检测,判定其是否为敏感图像。本发明可以高效的对互联网上的敏感图像进行检测并过滤,使广大青少年在享受互联网所带来的便利同时免受不良信息的毒害。
-
公开(公告)号:CN101470731A
公开(公告)日:2009-07-01
申请号:CN200710304224.1
申请日:2007-12-26
Applicant: 中国科学院自动化研究所
IPC: G06F17/30
Abstract: 本发明一种可个性化定制的网页过滤方法,包括步骤:用户实例网页和训练网页库特征提取;基于半监督学习的用户兴趣类属性挖掘;用户兴趣类的特征提取和特征选择;基于贝叶斯分类器的个性化网页过滤。本发明提出了一种新型的实例驱动的网页过滤框架,用户的过滤需求通过网页实例来表达,用户实例可以是任何类型或者多类型复合的网页,并借助半监督学习构造出符合用户个性化需求的网页过滤器,克服了传统网页过滤方法仅限于过滤单一或有限类型网页,难以实现个性化定制的缺点。本发明并具有高精确度、鲁棒性和运行速度的优点,具有很好的应用前景。
-
-
-
-
-
-