基于群件理解的不良彩信过滤方法

    公开(公告)号:CN101719924B

    公开(公告)日:2013-04-03

    申请号:CN200910311664.9

    申请日:2009-12-17

    Abstract: 一种信息技术领域的基于群件理解的不良彩信过滤方法,包括如下步骤:将每个处理组件分为四组样本,对每个处理组件分别训练形成四个分类器,得到处理组件的离线训练用样本库和决策树训练样本集,进而生成决策树;把彩信拆分成若干个单一媒体文件;进行基于内容理解的过滤处理,得到每个处理组件的反动概率、色情概率、恐怖概率和垃圾概率;将得到的概率组织成一个输入向量,输入到训练所得的决策树,得到彩信的过滤结果。本发明通过把彩信拆分成不同单一媒体文件,有效解决了彩信无法进行内容过滤的困难,提高了不良彩信过滤的实时性和客观性,过滤的效率和准确性明显提高。

    基于内容的互联网视频检索方法

    公开(公告)号:CN102254006A

    公开(公告)日:2011-11-23

    申请号:CN201110199667.5

    申请日:2011-07-15

    Abstract: 本发明提出一种基于内容的互联网视频检索方法,包括:步骤一,从互联网上随机采集若干视频作为训练样本集,建立视频库,并提取训练样本集中所有视频中每帧的分块颜色直方图特征和亮度特征作为镜头分割判断依据。步骤二,根据步骤一中提取的两种特征对训练样本集中的所有视频进行自适应方式镜头分割,并得到镜头分割列表。步骤三,根据镜头分割列表以及特征对训练样本集中的所有视频提取关键帧以及获得关键帧的索引。步骤四,对于一个待检索视频,首先按照步骤一,二和三处理之后得到关键帧列表,然后采用一种新的软性判决方法进行快速定位和检索。本发明可以实现视频的快速定位和检索,有较快的处理速度和较高的检索效率和检索正确率。

    基于有序二叉树的模式匹配方法

    公开(公告)号:CN101425084A

    公开(公告)日:2009-05-06

    申请号:CN200810203008.2

    申请日:2008-11-20

    Abstract: 一种信息技术领域的基于有序二叉树的多模式匹配方法,包括如下步骤:步骤一、对二叉树按NLR方式遍历,设定遍历二叉树时的顺序,得到一系列的模式串,如果这些模式串得到的先后顺序和它们的字典序相同,即获得有序二叉树,同时在有序二叉树上构造出失败指针,以重复利用已经匹配成功的模式串子串信息;步骤二、根据构造的有序二叉树及goto函数和失败指针对源字串进行一次查找,定位出模式串在源字串中的位置,查找的过程如下:从有序二叉树的根节点出发,逐个取出源字串中的字符,根据goto函数和失败指针确定状态之间的转换,当源字串的所有字符都被取出后,查找过程就结束。本发明特别适用于模式串集合动态变化的情况。

    敏感图像鉴定方法及终端系统

    公开(公告)号:CN109145979B

    公开(公告)日:2022-06-21

    申请号:CN201810929971.2

    申请日:2018-08-15

    Abstract: 本发明实施例涉及图像鉴别以及人工智能技术领域,公开了一种敏感图像鉴定方法及终端系统。该方法应用于敏感图像鉴定系统,该系统包括:骨干网络、全局分类网络以及目标区域检测网络,该方法包括:在有局部区域标注的图像训练集上训练所述目标区域检测网络得到骨干网络参数;其中,所述骨干网络参数为所述目标区域检测网络中与所述骨干网络结构相同的网络结构的网络参数;根据所述骨干网络参数对所述全局分类网络进行初始化;初始化后的所述全局分类网络在类别标注数据集上进行训练,采用训练好的所述全局分类网络进行敏感图像分类。本发明实施例可以检测到图像中大小各异的敏感区域,从而大幅提升敏感图像分类性能。

    面向信息流的安全推荐系统

    公开(公告)号:CN113609394A

    公开(公告)日:2021-11-05

    申请号:CN202110909752.X

    申请日:2021-08-09

    Abstract: 本发明提供了一种面向信息流的安全推荐系统,包括安全推荐模型,所述安全推荐模型包括对抗子系统、召回子系统、精排序子系统以及深度恶意检测器;所述对抗子系统模拟攻击、测试模型的防御效果;所述召回子系统基于流行度特征区分正常用户和恶意用户,生成推荐项目;所述精排序子系统通过对抗训练提高鲁棒性,推荐得分高的推荐项目;所述深度恶意检测器通过提取数据高位特征,识别恶意样本。本发明提高了对于信息流推荐系统中恶意用户样本的检测能力,减小了模型受到投毒攻击的可能;设计了高鲁棒性的精推荐模型,保证模型的公平无偏性,保护了推荐系统不会被攻击者利用。

    基于内容的互联网视频检索方法

    公开(公告)号:CN102254006B

    公开(公告)日:2013-06-19

    申请号:CN201110199667.5

    申请日:2011-07-15

    Abstract: 本发明提出一种基于内容的互联网视频检索方法,包括:步骤一,从互联网上随机采集若干视频作为训练样本集,建立视频库,并提取训练样本集中所有视频中每帧的分块颜色直方图特征和亮度特征作为镜头分割判断依据。步骤二,根据步骤一中提取的两种特征对训练样本集中的所有视频进行自适应方式镜头分割,并得到镜头分割列表。步骤三,根据镜头分割列表以及特征对训练样本集中的所有视频提取关键帧以及获得关键帧的索引。步骤四,对于一个待检索视频,首先按照步骤一,二和三处理之后得到关键帧列表,然后采用一种新的软性判决方法进行快速定位和检索。本发明可以实现视频的快速定位和检索,有较快的处理速度和较高的检索效率和检索正确率。

    基于主动推技术的互联网信息采集方法和装置

    公开(公告)号:CN102521379A

    公开(公告)日:2012-06-27

    申请号:CN201110428751.X

    申请日:2011-12-19

    Abstract: 本发明实施例提供了一种基于主动推技术的互联网信息采集方法和装置,其中该方法包括数据采集方和数据被采集方协商数据采集协议;所述数据被采集方按照所述数据采集协议把所述数据被采集方的特定数据主动推送到所述数据采集方;所述数据采集方接收所述特定数据,并且将所述特定数据进行存储;其中所述数据采集协议是指所述数据采集方和数据被采集方协商制定的数据提交规则,所述数据采集方是指采集网络信息数据的一方,所述数据被采集方是指提供网络信息数据的一方,所述特定数据是指在两次采集间隔内在数据被采集方上更新过的数据。本发明实施例所提供的方法和装置可以实现网络信息采集的及时性和全面性,能为搜索引擎、网络信息分析应用提供新型的采集技术。

    开放式文档同构引擎系统
    29.
    发明授权

    公开(公告)号:CN100552673C

    公开(公告)日:2009-10-21

    申请号:CN200710045451.7

    申请日:2007-08-30

    Abstract: 一种信息安全技术领域的开放式文档同构引擎系统,其中:物理结构模块接受各种文档的输入,并将文档的物理结构输出给逻辑结构模块;逻辑结构模块对物理结构模块输入的信息进行处理得到文档的逻辑结构,并将该其输入到词法及句法分析模块;词法及句法分析模块接收逻辑结构模块输入的信息,并对该信息进行处理得到经分析处理后的文档,并将得到的该文档输入概念抽取模块;概念抽取模块对词法及句法分析模块输入的信息进行处理得到由文档中的词转化出的概念及概念属性,并将得到的该概念及概念属性输入主题表示模块;主题表示模块对概念抽取模块输入的信息进行处理得到以概念为单位的文档主题。本发明解决了针对多格式文档无法统一处理的问题。

    基于内容的互联网动画媒体垃圾信息过滤方法

    公开(公告)号:CN101276417A

    公开(公告)日:2008-10-01

    申请号:CN200810036144.7

    申请日:2008-04-17

    Abstract: 一种图像处理和模式识别领域的基于内容的互联网动画媒体垃圾信息过滤方法,步骤一,从互联网上随机采集若干个广告和非广告的动画作为训练样本集,并提取所有动画的颜色特征、纹理特征、文字信息特征、动画长度特征、动画几何尺寸特征、动画的动态特征;步骤二,将有动画的六个特征以及类别标引输入到支持向量机中,支持向量机获得描述广告/非广告动画媒体差异的支持向量机模型;步骤三,按照步骤一中提取动画特征的方法提取待测试动画的六个特征,并输入支持向量机模型中,支持向量机模型判断出动画是属于广告类动画还是属于非广告类动画。本发明能够识别广告类动画和非广告类动画,有较高的处理速度和识别准确率。

Patent Agency Ranking