基于大语言模型的低成本、零样本的在线日志解析方法

    公开(公告)号:CN117407242B

    公开(公告)日:2024-04-05

    申请号:CN202311303412.8

    申请日:2023-10-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于大语言模型的低成本、零样本的在线日志解析方法,首先,使用正则表达式提取日志消息中的日志内容;然后与数据库中的日志模板进行正则匹配;匹配成功,更新对应日志模板的日志样本;匹配失败,则与大语言模型进行对话获得新的日志模板;并进行模板纠正,防止大语言模型生成的日志模板不能正则匹配日志消息;当产生新的模板时,进行模板合并;当更新日志样本时,进行模板拆分;对于所有即将加入数据库的日志模板,首先通过后处理进行日志模板规范化,然后将日志模板保存到数据库中。本发明生成的日志模板在单词的解析准确度上要优于传统方法,在速度和花费上相比于直接使用大语言模型执行日志解析任务具有显著优势。

    基于大语言模型的低成本、零样本的在线日志解析方法

    公开(公告)号:CN117407242A

    公开(公告)日:2024-01-16

    申请号:CN202311303412.8

    申请日:2023-10-10

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于大语言模型的低成本、零样本的在线日志解析方法,首先,使用正则表达式提取日志消息中的日志内容;然后与数据库中的日志模板进行正则匹配;匹配成功,更新对应日志模板的日志样本;匹配失败,则与大语言模型进行对话获得新的日志模板;并进行模板纠正,防止大语言模型生成的日志模板不能正则匹配日志消息;当产生新的模板时,进行模板合并;当更新日志样本时,进行模板拆分;对于所有即将加入数据库的日志模板,首先通过后处理进行日志模板规范化,然后将日志模板保存到数据库中。本发明生成的日志模板在单词的解析准确度上要优于传统方法,在速度和花费上相比于直接使用大语言模型执行日志解析任务具有显著优势。

Patent Agency Ranking