-
公开(公告)号:CN119416770A
公开(公告)日:2025-02-11
申请号:CN202411024430.7
申请日:2024-07-29
Applicant: 北京海联捷讯科技股份有限公司 , 北京邮电大学
IPC: G06F40/205 , G06F40/226 , G06F18/22
Abstract: 本发明提供一种基于大语言模型的日志解析方法及装置,该方法包括:确定样例日志及解析要求,将样例日志及解析要求输入至训练好的大语言模型,基于所述大语言模型得到样例日志对应的日志解析步骤,基于日志解析步骤确定样例日志及解析要求对应的结果结构;从待解析日志数据集合中确定用于生成日志模板的代表性日志数据集合;将样例日志、解析要求、日志解析步骤、结果结构及代表性日志数据集合输入至训练好的大语言模型中得到代表性日志数据集合对应的日志模板解析结果;其中,日志模板解析结果包括名称属性、描述属性、格式属性和样例属性;基于前缀树数据结构将日志模板解析结果存储为模板数据。本申请提高了日志解析的准确度和效率。
-
公开(公告)号:CN117076923A
公开(公告)日:2023-11-17
申请号:CN202310959504.5
申请日:2023-08-01
Applicant: 北京海联捷讯科技股份有限公司 , 北京邮电大学
IPC: G06F18/214 , G06F18/2415 , G06F18/2431 , G06F18/25 , G06N3/045 , G06N3/0464 , G06N3/047 , G06N3/048 , G06N3/08 , H04L47/2441 , H04L9/40
Abstract: 本申请提供一种网络流量分类模型训练方法、分类方法及训练装置,所述训练方法包括:选取目标历史网络流量数据集中的包头特征向量和负载特征矩阵;根据第一神经网络得到各个负载特征矩阵对应的多个负载分类得分向量;并根据第二神经网络得到各个包头特征向量对应的多个包头分类得分向量;对负载分类得分向量和包头分类得分向量进行加权求和,得到融合特征向量;将融合特征向量输入网络流量分类器中以得到各对应的多个流量类型的概率;在训练过程中,基于预设的分类损失函数计算分类损失对模型进行迭代训练,得到目标网络流量分类模型。本申请能够有效保证网络流量数据的完整性,进而有效提高了网络流量数据分类的准确性。
-