-
公开(公告)号:CN109947936B
公开(公告)日:2021-03-02
申请号:CN201810952482.9
申请日:2018-08-21
Applicant: 北京大学
IPC: G06F16/35 , G06F40/289 , G06F8/30 , G06N3/08
Abstract: 本发明公布了一种基于机器学习的动态识别垃圾邮件的方法,涉及垃圾邮件识别技术,通过采用LDA主题模型、Autoencoder自编码器,并创建线性模型,实现动态检测垃圾邮件,达到高效识别垃圾邮件的目的;包括:对模板邮件和样本邮件进行预处理;采用LDA主题模型对文本进行训练;使用自编码器词袋向量将独热编码向量进行压缩,转化为词向量;创建线性模型,通过线性模型对待识别邮件进行预测。采样本发明技术方案,能够动态检测、高效地识别垃圾邮件。
-
公开(公告)号:CN109947936A
公开(公告)日:2019-06-28
申请号:CN201810952482.9
申请日:2018-08-21
Applicant: 北京大学
Abstract: 本发明公布了一种基于机器学习的动态识别垃圾邮件的方法,涉及垃圾邮件识别技术,通过采用LDA主题模型、Autoencoder自编码器,并创建线性模型,实现动态检测垃圾邮件,达到高效识别垃圾邮件的目的;包括:对模板邮件和样本邮件进行预处理;采用LDA主题模型对文本进行训练;使用自编码器词袋向量将独热编码向量进行压缩,转化为词向量;创建线性模型,通过线性模型对待识别邮件进行预测。采样本发明技术方案,能够动态检测、高效地识别垃圾邮件。
-