基于概率的无监督缺陷预测方法

    公开(公告)号:CN106021115A

    公开(公告)日:2016-10-12

    申请号:CN201610395767.8

    申请日:2016-06-06

    Applicant: 重庆大学

    CPC classification number: G06F11/3684

    Abstract: 本发明涉及基于概率的无监督缺陷预测方法,包括如下步骤,S1获取度量元阈值,使用每个度量下源代码类的度量元值的中位数作为阈值;S2度量元值与阈值的差值概率化;S3聚类,计算所有度量元下每个文件的概率之和,具有相同值的类归为一类;S4标记,如果某类文件所对应的概率合大于等于L,则将该类文件标记为有缺陷,否则标记为无缺陷,从而将所有类标记为有缺陷和没有缺陷的两类。本发明方法使用概率表示类存在缺陷的可能性,不同度量元值得到的概率不同,保留类存在缺陷可能性大小的信息。在标记的过程中,根据数据集中缺陷的分布特点,选取合适的临界值进行标记。在避免信息丢失的同时,选择合适的标记临界值,提高了缺陷预测的性能。

    基于概率的无监督缺陷预测方法

    公开(公告)号:CN106021115B

    公开(公告)日:2018-07-10

    申请号:CN201610395767.8

    申请日:2016-06-06

    Applicant: 重庆大学

    Abstract: 本发明涉及基于概率的无监督缺陷预测方法,包括如下步骤,S1获取度量元阈值,使用每个度量下源代码类的度量元值的中位数作为阈值;S2度量元值与阈值的差值概率化;S3聚类,计算所有度量元下每个文件的概率之和,具有相同值的类归为一类;S4标记,如果某类文件所对应的概率合大于等于L,则将该类文件标记为有缺陷,否则标记为无缺陷,从而将所有类标记为有缺陷和没有缺陷的两类。本发明方法使用概率表示类存在缺陷的可能性,不同度量元值得到的概率不同,保留类存在缺陷可能性大小的信息。在标记的过程中,根据数据集中缺陷的分布特点,选取合适的临界值进行标记。在避免信息丢失的同时,选择合适的标记临界值,提高了缺陷预测的性能。

Patent Agency Ranking