基于稀疏线性在线学习的垃圾邮件分类方法及系统

    公开(公告)号:CN115329084A

    公开(公告)日:2022-11-11

    申请号:CN202211032809.3

    申请日:2022-08-26

    Applicant: 苏州大学

    Abstract: 本发明公开了一种基于稀疏线性在线学习的垃圾邮件分类方法及系统,方法包括:S1、利用随机傅里叶特征方法将特征化的电子邮件原始数据集映射为高维特征空间的训练样本,得到预处理后的训练样本集;S2、利用预处理后的训练样本集训练线性分类模型,并采用FTRL算法对模型参数进行更新,得到训练后的线性分类模型;S3、利用训练后的线性分类模型对电子邮件进行预测分类。本发明基于稀疏线性在线学习的垃圾邮件分类方法通过将特征化的电子邮件原始数据集映射为高维特征空间的训练样本,并在模型训练时采用FTRL算法对模型参数进行更新,在保留了线性分类模型快速高效特点的同时进一步取得了稀疏性,提升了分类准确率。

Patent Agency Ranking