一种基于主动学习的无监督缺陷程序模块识别方法

    公开(公告)号:CN109857653A

    公开(公告)日:2019-06-07

    申请号:CN201910042053.2

    申请日:2019-01-17

    Applicant: 南通大学

    Abstract: 本发明涉及一种基于主动学习的无监督缺陷程序模块识别方法,属于软件质量保障领域。本发明包括:1)从待测项目中抽取程序模块进行度量,形成数据集D;2)采用聚类方法将D内的程序模块分为可能有缺陷和可能没有缺陷两类,分别随机选k1个模块标记,形成已标记数据集L,和未标记数据集U,基于L构建预测模型;3)判断缺陷模块数查全率是否达预期,若达到,终止标记过程,否则执行步骤4);4)使用两阶段标记方法从U中选出一定数量的程序模块进行标记并添加到L中;5)基于L构建缺陷预测模型,执行步骤3)。本发明方法可以在不存在历史标记数据集的情况下,花费较少的标记代价,检测到被测项目内的绝大部分有缺陷程序模块。

Patent Agency Ranking