一种多语言垃圾邮件的检测方法、系统及终端设备

    公开(公告)号:CN120050255A

    公开(公告)日:2025-05-27

    申请号:CN202510094816.3

    申请日:2025-01-21

    Inventor: 林延中 卢翼翔

    Abstract: 本申请公开了一种多语言垃圾邮件的检测方法、系统及终端设备,包括:获取待检测的邮件数据;将所述邮件数据输入预设的语义识别模型,以将所述邮件数据中提取出的第一文本特征转换为文本矩阵,并基于所述文本矩阵确定对应的第一文本向量;将所述第一文本向量输入预设的垃圾邮件检测模型,以基于所述第一文本向量确定所述邮件数据属于垃圾邮件的概率值,并基于所述概率值确定垃圾邮件,其中,所述垃圾邮件检测模型是根据第二邮件训练集中的多维度特征和第二文本向量训练而获得,所述第二文本向量根据所述语义识别模型对所述第二邮件训练集中的第二文本特征推理确定。本申请可提高多语言垃圾邮件检测的准确性和效率。

Patent Agency Ranking