-
公开(公告)号:CN115328782A
公开(公告)日:2022-11-11
申请号:CN202210979206.8
申请日:2022-08-16
Applicant: 南京工业大学
Abstract: 本发明公开了如下技术方案,首先从源代码中提取图结构和抽象语法树结构;接着通过编码抽象语法树信息得到词向量序列作为双向循环神经网络的输入以学习源代码的语义特征并将得到的语义特征与传统静态特征结合作为图节点的状态向量表示;然后利用源代码完整的图表示预训练教师集成网络模型;最后通过知识蒸馏技术将知识从之前预训练完成的教师集成网络模型中提取出来并注入到学生集成网络模型中。本发明借助图神经网络的先进性和知识蒸馏技术的思想,相较现有技术,使得生成的学生集成网络模型能够实现更高的软件缺陷检测率,而且集成网络的设计保证了该模型的健壮性和鲁棒性。
-
公开(公告)号:CN115629980A
公开(公告)日:2023-01-20
申请号:CN202211325794.X
申请日:2022-10-27
Applicant: 南京工业大学
IPC: G06F11/36 , G06F18/214 , G06F18/2431 , G06N5/00 , G06N20/00
Abstract: 本发明涉及一种软件缺陷预测模型解释方法,针对目标软件所对应是否有缺陷的预测结果,首先基于对目标软件中各软件模块对应各待分析软件特征类型的特征数据,结合对各软件模块的是否缺陷的预测结果,获得各软件模块分别解释目标软件预测结果、所对应各待分析软件特征类型的重要度;然后基于对全部软件模块向各模块集合的划分,获得各模块集合分别解释目标软件预测结果、所对应的目标特征类型集合;最后基于各模块集合所对应目标特征类型集合之间的联系,获得解释目标软件预测结果的各个重要特征类型,解决现有技术不足,高效实现了对目标软件预测结果的解释。
-
公开(公告)号:CN115309647A
公开(公告)日:2022-11-08
申请号:CN202210959874.4
申请日:2022-08-11
Applicant: 南京工业大学
Abstract: 本发明涉及一种基于联邦学习的软件缺陷预测隐私保护方法,基于决策树构建的随机森林模型进行软件缺陷预测,解决了依赖集中存储企业私有数据进行模型训练的隐私泄露问题。首先,构建软件缺陷预测模型,分解成对数据集进行预处理,采用Bootstrap采样策略为每个决策树创建训练集和基于这些决策树组成随机森林模型部分;其次,利用构建的模型在内部各个部门上进行预测和训练,计算损失和局部梯度;然后,对局部梯度进行梯度剪裁并加入本地差分隐私技术,得到受保护的梯度,上传服务器;最后,由服务器聚合梯度,更新全局模型参数并分发给各个部门。本发明以一种隐私保护的方式,利用大量数据进行模型训练,训练出准确无偏的软件缺陷预测模型。
-
-