一种基于RNN神经网络和倒排索引的日志自动化解析方法

    公开(公告)号:CN114969241A

    公开(公告)日:2022-08-30

    申请号:CN202210588074.6

    申请日:2022-05-26

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于RNN神经网络和倒排索引的日志自动化解析方法,本发明的日志自动化解析技术分为三个阶段:第一个阶段针对解析完成的日志数据,将日志中的词分为模板类与变量类,并进行标准化处理得到标准化数据;第二个阶段基于RNN神经网络模型对经过处理后的标准化数据进行学习,学习得到能够对日志中词进行二分类的神经网络分类器,根据准确率、召回率和F指标选择最佳模型;第三个阶段根据得到的RNN分类模型,输入待解析的日志消息,对消息内的词进行分类,保留日志消息中模板类的词作为日志模板;利用倒排索引的方式对日志消息进行模板匹配。本发明中的模型具有很强的泛化能力,能够在不同的日志数据集上取得较高的解析精度。

    一种异常数据检测中谱聚类算法并行化方法及系统

    公开(公告)号:CN112988693A

    公开(公告)日:2021-06-18

    申请号:CN202110325195.7

    申请日:2021-03-26

    Applicant: 武汉大学

    Abstract: 本发明公开了一种异常数据检测中谱聚类算法并行化方法及系统,首先将待聚类分析的数据集样本进行数据分布式存储;然后并行化构建数据集样本的相似矩阵;并行化计算相似矩阵的拉普拉斯矩阵;并行化计算拉普拉斯矩阵的特征向量,获得维度为n×d的特征向量矩阵;最后并行化执行K‑mean聚类算法。经实验结果表明,本发明在面对海量日志数据的聚类分析时,在保证良好聚类效果的同时,算法的执行效率也得到显著提升。

    一种基于GBDT决策树的SaaS软件性能故障诊断方法

    公开(公告)号:CN109918313B

    公开(公告)日:2021-04-02

    申请号:CN201910247053.6

    申请日:2019-03-29

    Applicant: 武汉大学

    Abstract: 为了满足SaaS软件性能维护需求,本发明公开了一种结合性能日志基于GBDT决策树的SaaS软件性能故障诊断方法,采用监控的手段获取软件系统运行时性能日志,并结合警告日志的分析结果进行性能日志的性能故障类型标注,利用同类型均值填补方法以及组合SMOTE和前抽样方法对性能日志进行处理,以提供完整且均衡的性能日志数据,利用机器学习方法中的GBDT算法对性能日志进行分析并建立性能故障诊断模型,并将系统实时产生的性能日志输入到构建的诊断模型中,得到输出的对应性能故障类型,以此来对SaaS软件运行时的性能状态进行诊断。此外,在本发明中还会对实时的性能日志和诊断结果予以保存,每隔一段时间会对诊断模型进行更新,保证诊断模型的实时性,进一步确保诊断结果的准确性。

    一种基于元数据驱动的多样化服务的混合编排方法

    公开(公告)号:CN110618810A

    公开(公告)日:2019-12-27

    申请号:CN201910565669.8

    申请日:2019-06-27

    Applicant: 武汉大学

    Abstract: 服务协议的多样性带来了消息结构的多样性,而BPEL不支持多样化的服务消息结构,因此在多样化的服务组合存在服务交互不匹配的问题。对此本发明提出一种元数据驱动的多样化服务的混合编排方法,对多样化服务进行元数据建模,描述服务消息结构,服务适配器利用元数据转换多样化的服务消息,在统一的消息结构上定义流程中服务间的数据交互,总体结合了基于元数据的数据依赖定义和BPMN定义完整地描述一个流程。通过案例测试以及可用性评估,结果验证了方法的可行性。该方法在一定程度上解决了多样化服务编排的问题,对多样化的服务协议类型可扩展。

    一种基于多目标蚁群算法的面向网构应用模块的部署优化方法

    公开(公告)号:CN110427191A

    公开(公告)日:2019-11-08

    申请号:CN201910414369.X

    申请日:2019-05-17

    Applicant: 武汉大学

    Abstract: 本发明涉及一种基于多目标蚁群算法的面向网构应用模块的部署优化方法,自动地探索搜索空间,旨在为一个网构应用程序找到一组帕累托最优部署体系结构,其满足要求的性能和成本,并表现出对两者的折中。该算法是对传统算法的改进版本,它引入一个舍弃精英策略防止算法过早收敛,并设计一个局部搜索过程加速获得可行解决方案的过程。在三个不同规模的实例上执行一组的实验,结果表明MACO-DO算法比现有的部署优化算法更有前景。

    一种面向微服务调用过程跟踪的监控系统及方法

    公开(公告)号:CN107766205A

    公开(公告)日:2018-03-06

    申请号:CN201710937117.6

    申请日:2017-10-10

    Applicant: 武汉大学

    Abstract: 本发明公开了一种面向微服务调用过程跟踪的监控系统及方法,系统主要包括数据采集、数据传输和数据存储模块。数据采集模块采用动态AOP技术向通用组件中织入监控逻辑代码,无需修改业务代码,保证了监控功能对应用系统的透明性。数据传输模块采取基于消息队列的异步方式,使用消息中间件实现监控数据的接入和传输,缓和数据发送和数据处理两者速度不同步的问题,同时也降低了数据采集模块和数据存储模块之间的耦合性。数据存储以用户事务请求为单位,针对一次事务请求记录包含多次服务调用的情况,监控系统使用列式模型数据库来进行数据存储。

    一种基于数据起源技术的程序异常传播模型构造方法

    公开(公告)号:CN103279421A

    公开(公告)日:2013-09-04

    申请号:CN201310237839.2

    申请日:2013-06-14

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于数据起源技术的程序异常传播模型构造方法,本发明的异常传播模型的构造分为三个阶段:第一个阶段针对程序的每个方法构造方法的异常控制流图,第二个阶段基于生成的控制流图,进行数据流分析,生成异常的派生图和异常处理动作序列。第三个阶段将根据程序的每个方法之间的调用关系,将各个方法的异常传播图进行合并,生成整个程序的异常传播模型。本发明中的异常传播模型具有丰富的表达能力,能够完整表达和展现软件异常传播演变的过程,可以更有效辅助开发人员理解程序中的异常处理过程,分析异常处理机制中存在的问题,支持异常处理过程测试用例的组织,从而设计出合理有效的异常处理方案,使软件具有更高的健壮性。

    日志解析方法、装置、电子设备及存储介质

    公开(公告)号:CN119046253A

    公开(公告)日:2024-11-29

    申请号:CN202411039493.X

    申请日:2024-07-31

    Applicant: 武汉大学

    Abstract: 本申请涉及软件工程技术领域,特别涉及一种日志解析方法、装置、电子设备及存储介质,包括:对每个实时目标日志进行分割,得到每个实时目标日志对应的目标日志令牌,基于训练后的第一预设模型对每个目标日志令牌进行向量化,得到每个目标日志令牌的嵌入向量;基于训练后的第一预设模型生成的目标样本,利用每个目标日志令牌的嵌入向量和目标样本的平均相似性对每个目标日志令牌进行分类,并根据分类结果得到每个实时目标日志的日志模板,存储日志模板并更新日志模板集,以根据日志模板集解析至少一个实时目标日志。由此,解决了相关技术的日志解析方法受限于数据驱动特性,使得日志文本处理能力和适应能力较低以及解析效率和准确性低等问题。

    Apache Spark平台性能预测建模方法以及参数配置方法

    公开(公告)号:CN114968742B

    公开(公告)日:2024-10-22

    申请号:CN202210599957.7

    申请日:2022-05-26

    Applicant: 武汉大学

    Abstract: 本发明公开了Apache Spark平台性能预测建模方法以及参数配置方法,首先对Spark中的任务进行建模,然后对Spark中的任务执行阶段进行建模,最后运用Adaboost算法对已完成建模的部分进行集成。通过运用Adaboost方法对特定的基于Spark的应用进行建模预测,可以有效地选择最佳参数对Spark平台进行配置。本发明公开了一种基于Adaboost对Spark平台进行建模预测的方法,采用经典的投影抽样方法,允许在小训练样本的情况下满足建模精确度的要求,来对性能进行建模预测,指导参数的选择。

    一种基于密度加权集成规则的日志异常检测方法

    公开(公告)号:CN112711665B

    公开(公告)日:2022-04-15

    申请号:CN202110063328.8

    申请日:2021-01-18

    Applicant: 武汉大学

    Abstract: 本发明提出了一种基于密度加权集成规则的日志异常检测方法。本发明引入多条软件日志,根据软件日志,构建单词频次向量;根据单词频次向量,使用基于改进的谱聚类方法得到正常簇、异常簇,并计算得到正常日志集和异常日志集,构建平衡日志集;基分类器将平衡日志集作为训练集,用训练后的基分类器构建多基分类器,用多基分类器对待分类的样本进行分类,基分类器产生分类概率向量;根据分类概率向量,通过五个新的集成规则,分别得到五个分类结果,从中选择频次最大的分类结果作为最终的分类结果。本发明优点在于,保证了样本的平衡,且考虑了原始数据的分布,新的集成规则还考虑了待分类样本与历史数据之间的关系,提高了分类结果的准确性。

Patent Agency Ranking