-
公开(公告)号:CN120066962A
公开(公告)日:2025-05-30
申请号:CN202510132189.8
申请日:2025-02-06
Applicant: 郑州轻工业大学
IPC: G06F11/3668 , G06F18/231 , G06F18/23213 , G06N3/088
Abstract: 本发明公开了基于堆叠泛化分层聚类的无监督工作量感知缺陷预测方法(UEADPSHC),涉及软件缺陷预测技术领域。本发明第一层采用KMedoids、KMeans++和CURE进行初步聚类,充分捕捉数据的多样性和复杂结构,更全面地揭示数据中的不同特征。第二层使用EMA和MeanShift对第一层的聚类结果和原始输入特征进行进一步优化。结合了原始特征和聚类特征,保留更多的信息,更准确地捕捉数据的内在结构。对聚类结果采用随机化多数投票法进行预测。选择出现频率最高的预测类别作为最终结果,如遇平局则随机选择一个类别。在性能上取得了显著的改善,为未来工作提供了有益的指导,强调了基于Stacking分层聚类的无监督工作量感知缺陷预测的潜在优势。
-
公开(公告)号:CN120086110A
公开(公告)日:2025-06-03
申请号:CN202510163853.5
申请日:2025-02-14
Applicant: 郑州轻工业大学
IPC: G06F11/3604 , G06F18/213 , G06F18/25 , G06F18/20 , G06F18/2413 , G06N3/0442 , G06N3/045 , G06N3/08
Abstract: 本发明公开了基于图代码语义的软件缺陷预测方法,包括步骤:S1、提取控制流图/程序依赖图:使用改进的Java工具TinyPDG解析源代码,获得Java类中所有方法的控制流图/程序依赖图;S2、连续词袋模型训练与提取方法级别的特征向量:利用连续词袋模型对控制流图和程序依赖图的语料库进行训练,结合多头注意力和双向长短期记忆网络提取方法级别的特征向量;S3、联合特征提取:基于加权和的方法,将方法级别的特征向量聚合为文件级别的特征向量,然后结合手工标记特征,构造联合特征;S4、经过数据的平衡化处理后,使用机器学习模型作为分类器进行缺陷预测。本发明结合深度学习方法来进行跨项目缺陷数量预测,通过使用自然语言处理方法对控制流图/程序依赖图来提取语义特征,然后使用深度学习方法匹方法级别的特征,并和手工标记特征进行联合,提高了模型在项目缺陷预测方面的性能。
-
公开(公告)号:CN118626384A
公开(公告)日:2024-09-10
申请号:CN202410817614.2
申请日:2024-06-24
Applicant: 郑州轻工业大学
IPC: G06F11/36 , G06F18/2135 , G06F18/23 , G06N20/20
Abstract: 本发明公开了基于聚类集成学习的软件缺陷预测方法,涉及软件缺陷预测技术领域。本发明与之前的软件缺陷预测方法相比,解决了现有软件缺陷预测方法需要大量数据进行对比,耗费大量时间及运行成本;只通过单一的聚类方法从特定的角度分析和处理数据,无法全面捕捉数据的特征和模式的问题;结合卡方检验和稀疏主成分分析的特征选择策略来进行特征选择;首先用卡方检验筛选出最具有统计显著性的特征,再使用稀疏主成分分析对这些显著特征进行降维;还基于谱聚类、纽曼聚类、流体聚类和CNM聚类四种方法组成的聚类集成方法进行软件缺陷预测。在性能上取得了显著的改善;为未来工作提供了有益的指导,强调了聚类集成方法在无监督学习中的潜在优势。
-
-