一种基于机器学习动态检测垃圾邮件的方法

    公开(公告)号:CN109947936B

    公开(公告)日:2021-03-02

    申请号:CN201810952482.9

    申请日:2018-08-21

    Applicant: 北京大学

    Inventor: 文伟平 冯超

    Abstract: 本发明公布了一种基于机器学习的动态识别垃圾邮件的方法,涉及垃圾邮件识别技术,通过采用LDA主题模型、Autoencoder自编码器,并创建线性模型,实现动态检测垃圾邮件,达到高效识别垃圾邮件的目的;包括:对模板邮件和样本邮件进行预处理;采用LDA主题模型对文本进行训练;使用自编码器词袋向量将独热编码向量进行压缩,转化为词向量;创建线性模型,通过线性模型对待识别邮件进行预测。采样本发明技术方案,能够动态检测、高效地识别垃圾邮件。

    一种基于机器学习动态检测垃圾邮件的方法

    公开(公告)号:CN109947936A

    公开(公告)日:2019-06-28

    申请号:CN201810952482.9

    申请日:2018-08-21

    Applicant: 北京大学

    Inventor: 文伟平 冯超

    Abstract: 本发明公布了一种基于机器学习的动态识别垃圾邮件的方法,涉及垃圾邮件识别技术,通过采用LDA主题模型、Autoencoder自编码器,并创建线性模型,实现动态检测垃圾邮件,达到高效识别垃圾邮件的目的;包括:对模板邮件和样本邮件进行预处理;采用LDA主题模型对文本进行训练;使用自编码器词袋向量将独热编码向量进行压缩,转化为词向量;创建线性模型,通过线性模型对待识别邮件进行预测。采样本发明技术方案,能够动态检测、高效地识别垃圾邮件。

Patent Agency Ranking