-
公开(公告)号:CN115086182B
公开(公告)日:2024-06-11
申请号:CN202210696543.6
申请日:2022-06-20
Applicant: 深圳市恒扬数据股份有限公司
IPC: H04L41/14 , H04L51/212 , H04L51/42 , H04L9/40 , G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本申请涉及大数据技术领域,提供了一种邮件识别模型的优化方法、装置、电子设备及存储介质,其中,该方法包括:获取邮件识别模型对邮件样本的识别结果,以及用户对所述邮件样本的反馈结果,所述邮件识别模型用于根据所述邮件样本的第一编码特征确定所述识别结果,所述第一编码特征由所述邮件样本中的词语在预设的词袋库中的映射确定,所述词袋库包括至少两个短语;若所述识别结果与所述反馈结果不一致,则更新所述词袋库,得到更新后的词袋库;根据所述更新后的词袋库确定所述邮件样本的第二编码特征;根据所述第二编码特征优化所述邮件识别模型的参数;根据优化后的所述邮件识别模型的参数得到目标邮件识别模型。通过上述方法提高了识别准确率。
-
公开(公告)号:CN115086182A
公开(公告)日:2022-09-20
申请号:CN202210696543.6
申请日:2022-06-20
Applicant: 深圳市恒扬数据股份有限公司
IPC: H04L41/14 , H04L51/212 , H04L51/42 , H04L9/40 , G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本申请涉及大数据技术领域,提供了一种邮件识别模型的优化方法、装置、电子设备及存储介质,其中,该方法包括:获取邮件识别模型对邮件样本的识别结果,以及用户对所述邮件样本的反馈结果,所述邮件识别模型用于根据所述邮件样本的第一编码特征确定所述识别结果,所述第一编码特征由所述邮件样本中的词语在预设的词袋库中的映射确定,所述词袋库包括至少两个短语;若所述识别结果与所述反馈结果不一致,则更新所述词袋库,得到更新后的词袋库;根据所述更新后的词袋库确定所述邮件样本的第二编码特征;根据所述第二编码特征优化所述邮件识别模型的参数;根据优化后的所述邮件识别模型的参数得到目标邮件识别模型。通过上述方法提高了识别准确率。
-