基于改进特征评估函数的贝叶斯垃圾邮件过滤方法

    公开(公告)号:CN104731772B

    公开(公告)日:2017-05-24

    申请号:CN201510179688.9

    申请日:2015-04-14

    Applicant: 辽宁大学

    Abstract: 基于改进特征评估函数的贝叶斯垃圾邮件过滤方法,步骤如下:1)对训练邮件集进行预处理分为邮件头部和正文部分;2)分别在两个特征集T1,T2中删除介词、代词、副词、助词,连接词以及词频低于给定的阈值p的词语;3)分别在特征项集合T1’,T2’中运用改进的特征评估函数计算出互信息值MI(tk)’;4)在训练集内,对MI(tk)’其按从大到小的顺序进行排序,选择前n个值对应的特征项用于训练集的表示;5)分类阶段运用贝叶斯分类器对待测试的样本进行垃圾邮件过滤。本发明能够高效准确的对邮件进行分类,并且过滤掉垃圾邮件。

    基于改进特征评估函数的贝叶斯垃圾邮件过滤方法

    公开(公告)号:CN104731772A

    公开(公告)日:2015-06-24

    申请号:CN201510179688.9

    申请日:2015-04-14

    Applicant: 辽宁大学

    Abstract: 基于改进特征评估函数的贝叶斯垃圾邮件过滤方法,步骤如下:1)对训练邮件集进行预处理分为邮件头部和正文部分;2)分别在两个特征集T1,T2中删除介词、代词、副词、助词,连接词以及词频低于给定的阈值p的词语;3)分别在特征项集合T1’,T2’中运用改进的特征评估函数计算出互信息值MI(tk)’;4)在训练集内,对MI(tk)’其按从大到小的顺序进行排序,选择前n个值对应的特征项用于训练集的表示;5)分类阶段运用贝叶斯分类器对待测试的样本进行垃圾邮件过滤。本发明能够高效准确的对邮件进行分类,并且过滤掉垃圾邮件。

Patent Agency Ranking