一种软件缺陷预测模型解释方法
    1.
    发明公开

    公开(公告)号:CN115629980A

    公开(公告)日:2023-01-20

    申请号:CN202211325794.X

    申请日:2022-10-27

    Abstract: 本发明涉及一种软件缺陷预测模型解释方法,针对目标软件所对应是否有缺陷的预测结果,首先基于对目标软件中各软件模块对应各待分析软件特征类型的特征数据,结合对各软件模块的是否缺陷的预测结果,获得各软件模块分别解释目标软件预测结果、所对应各待分析软件特征类型的重要度;然后基于对全部软件模块向各模块集合的划分,获得各模块集合分别解释目标软件预测结果、所对应的目标特征类型集合;最后基于各模块集合所对应目标特征类型集合之间的联系,获得解释目标软件预测结果的各个重要特征类型,解决现有技术不足,高效实现了对目标软件预测结果的解释。

    一种基于联邦学习的软件缺陷预测隐私保护方法

    公开(公告)号:CN115309647A

    公开(公告)日:2022-11-08

    申请号:CN202210959874.4

    申请日:2022-08-11

    Abstract: 本发明涉及一种基于联邦学习的软件缺陷预测隐私保护方法,基于决策树构建的随机森林模型进行软件缺陷预测,解决了依赖集中存储企业私有数据进行模型训练的隐私泄露问题。首先,构建软件缺陷预测模型,分解成对数据集进行预处理,采用Bootstrap采样策略为每个决策树创建训练集和基于这些决策树组成随机森林模型部分;其次,利用构建的模型在内部各个部门上进行预测和训练,计算损失和局部梯度;然后,对局部梯度进行梯度剪裁并加入本地差分隐私技术,得到受保护的梯度,上传服务器;最后,由服务器聚合梯度,更新全局模型参数并分发给各个部门。本发明以一种隐私保护的方式,利用大量数据进行模型训练,训练出准确无偏的软件缺陷预测模型。

    一种基于代码表示学习的即时软件缺陷预测方法

    公开(公告)号:CN111858323B

    公开(公告)日:2021-06-01

    申请号:CN202010665255.5

    申请日:2020-07-11

    Abstract: 本发明涉及一种基于代码表示学习的即时软件缺陷预测方法,借助自然语言模型思想,解决了传统神经网络无法解决长距离依赖的问题;首先审查代码变更信息,分解成提交信息和代码变更两部分;接着编码代码变更信息,得到基于单词嵌入、段落嵌入和位置嵌入等词向量序列;然后利用注意力机制构建Transformer编码器模型;最后预训练之前的编码序列,构建基于代码表示学习的代码缺陷预测模型。本发明相较现有技术,应用注意力机制的优势,构造出Transformer编码器作为模型进行两项预训练任务,使得生成的语言模型更加健壮,能更好地表示代码变更信息,进而提高软件缺陷的检测率。

    一种基于代码表示学习的即时软件缺陷预测方法

    公开(公告)号:CN111858323A

    公开(公告)日:2020-10-30

    申请号:CN202010665255.5

    申请日:2020-07-11

    Abstract: 本发明涉及一种基于代码表示学习的即时软件缺陷预测方法,借助自然语言模型思想,解决了传统神经网络无法解决长距离依赖的问题;首先审查代码变更信息,分解成提交信息和代码变更两部分;接着编码代码变更信息,得到基于单词嵌入、段落嵌入和位置嵌入等词向量序列;然后利用注意力机制构建Transformer编码器模型;最后预训练之前的编码序列,构建基于代码表示学习的代码缺陷预测模型。本发明相较现有技术,应用注意力机制的优势,构造出Transformer编码器作为模型进行两项预训练任务,使得生成的语言模型更加健壮,能更好地表示代码变更信息,进而提高软件缺陷的检测率。

    一种基于多粒度级联森林模型的代码异味检测方法

    公开(公告)号:CN112015641B

    公开(公告)日:2022-02-01

    申请号:CN202010852852.9

    申请日:2020-08-22

    Abstract: 本发明涉及一种基于多粒度级联森林模型的代码异味检测方法,首先获得代码样本所对的六个质量维度特征的值;之后由检测工具获得对代码样本关于是否有异味的标记;然后通过对样本代码的划分,获得所对应的多个特征子样本向量,通过各特征子样本向量相对代码样本所对应异味检测标记值的概率值,实现代码样本分别所对应表征向量的获得;最后应用代码样本所对应的表征向量针对级联森林网络进行训练,获得代码样本相对其异味检测标记值的概率值,结合代码样本关于是否有异味的标记,完成对代码样本是否具有异味的判断;整个设计架构能够有效提高代码异味检测的工作效率,帮助程序员在一定程度上避免代码缺陷、及早发现重构目标,从而节约维护成本。

    一种基于多维度代码联合图表示的软件缺陷预测方法

    公开(公告)号:CN117215935A

    公开(公告)日:2023-12-12

    申请号:CN202311174665.X

    申请日:2023-09-12

    Abstract: 本发明涉及一种基于多维度代码联合图表示的软件缺陷预测方法。首先将含有代码缺陷标签的源代码提交至存储库中,将存储库中的源代码分解成代码内容信息和代码注释信息,接着通过提取代码内容信息中的抽象语法树,同时对抽象语法树进行遍历,获取其中的依赖关系表征数据和调用关系表征数据,再从代码注释中抽取的词序列并与抽象语法树的节点序列一同输入到Word2Vec模型得到对应的词向量再进行拼接得到图节点的最终表示,然后利用获取的依赖关系和调用关系构建相应的边,获取完整的图结构表示,最后将图结构表示输入到图卷积神经网络GCN预测模型中完成即使缺陷预测任务。本发明借助图神经网络的先进性和优势,通过注释和代码联合图能更好的表示代码信息,进而提高软件缺陷的准确性。

    一种基于多粒度级联森林模型的代码异味检测方法

    公开(公告)号:CN112015641A

    公开(公告)日:2020-12-01

    申请号:CN202010852852.9

    申请日:2020-08-22

    Abstract: 本发明涉及一种基于多粒度级联森林模型的代码异味检测方法,首先获得代码样本所对的六个质量维度特征的值;之后由检测工具获得对代码样本关于是否有异味的标记;然后通过对样本代码的划分,获得所对应的多个特征子样本向量,通过各特征子样本向量相对代码样本所对应异味检测标记值的概率值,实现代码样本分别所对应表征向量的获得;最后应用代码样本所对应的表征向量针对级联森林网络进行训练,获得代码样本相对其异味检测标记值的概率值,结合代码样本关于是否有异味的标记,完成对代码样本是否具有异味的判断;整个设计架构能够有效提高代码异味检测的工作效率,帮助程序员在一定程度上避免代码缺陷、及早发现重构目标,从而节约维护成本。

    一种面向隐私保护的联邦自蒸馏软件缺陷预测方法

    公开(公告)号:CN119357046A

    公开(公告)日:2025-01-24

    申请号:CN202411342039.1

    申请日:2024-09-25

    Abstract: 本发明涉及一种面向隐私保护的联邦自蒸馏软件缺陷预测方法,基于深度学习MLP模型,进行本地软件缺陷预测,解决了模型训练中隐私泄露问题;并应用本地差分隐私算法,在上传局部模型参数之前,通过噪声添加技术,对模型参数进行隐私保护,使得客户端不依赖于服务器;同时利用联邦学习隐私保护框架,用于多个客户端在不共享其私有数据的情况下协作训练模型,解决了单一数据不足以训练出性能优异的软件缺陷预测模型的问题;并且引入知识自蒸馏技术,在协作训练学习到其他客户端模型知识的同时,通过本客户端的历史模型完善本地模型的个性化。通过联邦学习不断更新全局模型参数,训练出学习能力强、预测性能好的软件缺陷预测模型。

    基于图表示学习和知识蒸馏的半监督软件缺陷预测方法

    公开(公告)号:CN115328782A

    公开(公告)日:2022-11-11

    申请号:CN202210979206.8

    申请日:2022-08-16

    Abstract: 本发明公开了如下技术方案,首先从源代码中提取图结构和抽象语法树结构;接着通过编码抽象语法树信息得到词向量序列作为双向循环神经网络的输入以学习源代码的语义特征并将得到的语义特征与传统静态特征结合作为图节点的状态向量表示;然后利用源代码完整的图表示预训练教师集成网络模型;最后通过知识蒸馏技术将知识从之前预训练完成的教师集成网络模型中提取出来并注入到学生集成网络模型中。本发明借助图神经网络的先进性和知识蒸馏技术的思想,相较现有技术,使得生成的学生集成网络模型能够实现更高的软件缺陷检测率,而且集成网络的设计保证了该模型的健壮性和鲁棒性。

Patent Agency Ranking