基于样本分布特征和SPY算法的软件缺陷预测方法

    公开(公告)号:CN113434401B

    公开(公告)日:2022-10-28

    申请号:CN202110703322.2

    申请日:2021-06-24

    Abstract: 本发明公开了一种基于样本分布特征和SPY算法的软件缺陷预测方法;本发明基于软件缺陷数据集的分布特征,提出了边界k值确定公式。根据公式为不同的数据集选择合适的少数类边界样本。此外,本发明将SPY算法和边界采样算法结合,通过边缘样本优化SPY算法,将少数类边界区域的部分多数类样本设置成为SPY样本,并为SPY样本设置较小训练样本权重,在原始少数类边界区域内部使用边界采样的算法。SPY样本可以对边界上的少数类样本起到引导的作用,确保边界区域的少数类样本能够被正确分类。同时,通过为SPY样本设立一个较小的样本权重,减少了SPY样本对多数类样本的分类影响,最终达到一个较好的分类效果。

    基于样本分布特征和SPY算法的软件缺陷预测方法

    公开(公告)号:CN113434401A

    公开(公告)日:2021-09-24

    申请号:CN202110703322.2

    申请日:2021-06-24

    Abstract: 本发明公开了一种基于样本分布特征和SPY算法的软件缺陷预测方法;本发明基于软件缺陷数据集的分布特征,提出了边界k值确定公式。根据公式为不同的数据集选择合适的少数类边界样本。此外,本发明将SPY算法和边界采样算法结合,通过边缘样本优化SPY算法,将少数类边界区域的部分多数类样本设置成为SPY样本,并为SPY样本设置较小训练样本权重,在原始少数类边界区域内部使用边界采样的算法。SPY样本可以对边界上的少数类样本起到引导的作用,确保边界区域的少数类样本能够被正确分类。同时,通过为SPY样本设立一个较小的样本权重,减少了SPY样本对多数类样本的分类影响,最终达到一个较好的分类效果。

Patent Agency Ranking