-
公开(公告)号:CN107391370A
公开(公告)日:2017-11-24
申请号:CN201710571131.9
申请日:2017-07-13
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于数据过采样和集成学习的软件缺陷数目预测方法,首先利用过采样技术通过增加缺陷数据集中缺陷数目为大于零的软件模块得到相对平衡的新数据集,然后利用相对平衡的缺陷数据集训练出若干个弱的软件缺陷数目预测模型,最后集成这些弱的软件缺陷数目预测模型来预测待预测的软件模块的缺陷数目。本发明的技术方案既能够解决缺陷数据集中数据不平衡的问题,又能够结合多个弱的预测模型来提高软件缺陷数目预测模型的性能。
-
公开(公告)号:CN107391369A
公开(公告)日:2017-11-24
申请号:CN201710571098.X
申请日:2017-07-13
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于数据筛选和数据过采样的跨项目缺陷预测方法,设计了合理的数据筛选和数据不平衡处理策略,利用层次聚类算法筛选出真正和本项目模块数据相似的跨项目历史软件模块数据,使跨项目软件缺陷预测模型避免受到不相关跨项目历史软件模块数据的影响,然后利用过采样方法增加有缺陷的软件模块数据得到分类相对平衡的新数据集,使跨项目软件缺陷预测模型避免受到不平衡的训练数据集的影响。本发明的技术方案具有简单高效的特点,能够较好地提高跨项目软件缺陷预测模型的性能。
-