一种基于数据不平衡的软件缺陷预测方法

    公开(公告)号:CN110471856A

    公开(公告)日:2019-11-19

    申请号:CN201910775361.6

    申请日:2019-08-21

    Abstract: 本发明公开了一种基于数据不平衡的软件缺陷预测方法,包括:从已知bug分布的项目中,将具有软件度量值的各类错误报告作为预测使用的原始数据集;采用RSMOTE不平衡处理策略对原数据集中文本矩阵进行不平衡处理、得到平衡数据集;使用朴素贝叶斯、多项式朴素贝叶斯、K近邻、支持向量机、分类树、和Adacost对平衡数据集进行建模找到预测效果最佳的分类器;提取未知bug位置的新项目的软件度量值,输入分类器,进行预测,输出每个程序段是否有bug的预测信息,并进行记录存储。本方法采用了RSMOTE不平衡处理策略对原数据集中文本矩阵进行不平衡处理,因此生成少数类样例更加灵活,能够产生更加广泛合理的样例。

    一种基于高维数据混合约简的缺陷报告指派方法

    公开(公告)号:CN110471854A

    公开(公告)日:2019-11-19

    申请号:CN201910770489.3

    申请日:2019-08-20

    Abstract: 本发明公开了一种基于高维数据混合约简的缺陷报告指派方法,包括如下步骤:S1:从缺陷报告系统中获取缺陷报告的故障文本信息、故障元信息和故障触发时间信息;S2:将缺陷报告定义为文本,选择能表现文本信息的词段,并采用分词、去停词、词干化和向量空间表示方法对缺陷报告进行标准化处理,S3:基于差分进化算法采用特征选择、实例选择和二者相结合的方式对缺陷报告进行数据约简;S4:读取缺陷报告的开发人员参与度信息,筛选处理过具有相同产品信息的bug报告的开发人员,对缺陷报告进行再次分类;S5:当有未被分类的缺陷报告提交时,使用结合开发人员参与度的数据约简策略为其分类,分配合适的开发人员处理该缺陷报告。

    一种高影响力缺陷报告识别方法

    公开(公告)号:CN110413792A

    公开(公告)日:2019-11-05

    申请号:CN201910728451.X

    申请日:2019-08-08

    Abstract: 本发明公开了一种高影响力缺陷报告识别方法,本方法将不平衡学习技术与多类分类方法相结合,解决了错误报告组件分类问题。使用四种不平衡处理策略RUS、ROS、SMOTE和Adacost算法来处理数据并获得平衡的数据集。然后使用基于NBM,KNN和SVM分类器的OVO和OVA多类别分类方法对平衡之后的数据集进行错误报告组件分类。通过探究不平衡学习策略和分类别分类算法的不同组合,找到具有错误报告组件分类最佳性能的变体。通过使用错误组件分类来确定为错误报告分配合适的开发人员,从而更好地解决了错误报告的分类问题。该方法不仅可以减少原始训练集的单词维度,提高训练集的质量,也提高错误报告的分类性能。

    一种基于迁移学习和特征提取的Bug报告严重程度识别方法

    公开(公告)号:CN109614489A

    公开(公告)日:2019-04-12

    申请号:CN201811528863.0

    申请日:2018-12-13

    Abstract: 本发明公开了一种基于迁移学习和特征提取的Bug报告严重程度识别方法,通过将向量化表示的Bugzilla Bug报告信息作为知识库;并使用粗糙集特征提取方法对向量化表示的文本矩阵进行特征提取,将提取的特征作为迁移学习的最终知识库,用于识别Android Bug报告的严重程度。通过上述方法可以实现Android Bug报告管理系统中Bug报告严重程度的自动预测,节省了Bug报告严重程度预测所需的时间成本和人力成本,提升了工作效率。

    基于不平衡学习策略高影响缺陷报告预测方法

    公开(公告)号:CN109491914A

    公开(公告)日:2019-03-19

    申请号:CN201811333585.3

    申请日:2018-11-09

    Abstract: 本发明公开了一种基于不平衡学习策略高影响缺陷报告预测方法:使用文本预处理方法对缺陷报告的文本信息进行处理;将处理后文本信息分储为训练集和测试集;对训练集做多次数据平衡处理;使用多个分类器对经过平衡处理的训练集进行训练;把多个分类器的优点进行集成并输出;使用文本特征提取模块来对测试集中的缺陷报告进行文本特征提取;使用训练好的模型对测试集中的缺陷报告进行预测。本发明克服了数据的不平衡特性并加以利用,将不平衡学习策略与约束求解相结合,基于不同分类算法的不同能力,提出了利用权重优化每个分类器的判别概率以提高分类效果,并将优化后的多个分类器进行集成,通过获取更合适的权重来获得更高的准确率。

    问答网站中问题回答者推荐方法

    公开(公告)号:CN109408726A

    公开(公告)日:2019-03-01

    申请号:CN201811333596.1

    申请日:2018-11-09

    Abstract: 本发明公开了一种问答网站中问题回答者推荐方法,具有如下步骤:推荐系统接收提问者信息以及问题信息,提取问答网站的数据;构建用户间关系的网络图;将网络图利用Weighted LeaderRank算法得出用户排名;对所有用户形成一个社团分类;根据用户排名和社团分类,确定出每个社团中的用户排名;根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户,由其来解答问题,然后将答案反馈给提问者用户。本发明通过对提问者进行社团划分,然后推荐给与其相同社团的用户,能够缩短问题解决的时间,提高问题回答的准确性和质量,促进技术性问答网站中问题的解决。

    一种用于Simulink测试的测试用例优先排序方法

    公开(公告)号:CN115098358B

    公开(公告)日:2024-10-01

    申请号:CN202210557212.4

    申请日:2022-05-19

    Abstract: 本发明公开了一种用于Simulink测试的测试用例优先排序方法,包括:利用测试用例随机生成工具生成测试用例;统计每个测试用例中出现的Simulink模块名、模块出现的次数、子系统层数、僵尸块比例以及相关的测试用例结构信息;利用已统计的测试用例信息计算每个测试用例的特征块、复杂度以及僵尸块比例三大类特征;构建特征向量FV;基于特征向量FV计算每两个测试用例之间的差异度,综合僵尸块比例和差异度对Simulink测试用例进行优先排序;利用差分测试程序对优先排序结果进行测试,该方法解决了差分测试框架下自动测试的有效性问题,为Simulink的加速测试提供了新思路。

    一种基于子系统和数据恢复的Simulink测试方法

    公开(公告)号:CN114816988B

    公开(公告)日:2024-08-13

    申请号:CN202210267643.7

    申请日:2022-03-17

    Abstract: 本发明公开了一种基于子系统和数据恢复的Simulink测试方法,包括:采用随机生成方式生成测试用例,建立测试用例集,收集用于扩大测试用例集的被测试软件的第三方使用案例;对测试用例集中的所有测试用例进行预处理操作,对运行的测试用例进行基突变;创建一个存储测试用例集内每个测试用例中所有模块类型前后连接关系的数据库;采用蒙特卡罗马尔科夫链方式抽样选取测试集中的测试用例,将抽到的测试用例命名为原始测试用例;复制原始测试用例生成新测试用例并命名为变体测试用例,并对变体测试用例进行变异操作;对原始测试用例和生成的变体测试用例进行基于等效模输入的差分测试,同时记录出现错误的软件。

    一种Simulink代码生成工具测试方法

    公开(公告)号:CN114911694B

    公开(公告)日:2024-06-28

    申请号:CN202210349093.3

    申请日:2022-04-01

    Abstract: 本发明公开了一种基于等价优化变异策略的simulink代码生成工具测试方法,包括:采集并生成测试用例;采用PSO粒子群算法对测试用例库的模型进行优化;对筛选后得到的种子模型进行参数配置和链接时优化得到重构模型,链接时优化模型结构重构过程:利用Simulink代码生成工具为重构模型和原种子模型生成对应目标异构代码;采用差分测试比较重构模型、原种子模型和对应异构c语言代码文件,执行程序的执行轨迹,对种子模型和待测用例进行编译运行,若编译出现错误,则记录该错误信息,分别比较种子模型和待测用例的普通模式和SIL模式的输入输出值,如果三者等价,则完成该用例的测试过程,如果存在差异,并认定为发现bug。

    一种基于图神经网络的代码漏洞检测方法

    公开(公告)号:CN118094562A

    公开(公告)日:2024-05-28

    申请号:CN202410293494.0

    申请日:2024-03-14

    Abstract: 本发明提供了一种基于图神经网络的代码漏洞检测方法,包括如下步骤:S1、获取数据集,将数据集中的代码片段表示为抽象语法树,利用抽象语法树生成控制流图,得到控制流图中的节点和邻接矩阵;S2、将节点和邻接矩阵图嵌入图嵌入到图神经网络模型中,利用图神经网络模型将节点信息和邻接矩阵信息传递给相邻节点,从而利用信息扩散机制来学习图结构数据,根据节点的相连性更新节点状态,得到代码片段的矩阵向量;S3、训练一个多层感知器模型,将矩阵向量输入至MLP模型中,得到预测分数,将预测分数与设定好的阈值相比较来确定代码片段是否有漏洞。本发明基于图的表征相对于序列或树能够显式表征更多维度的代码特征,能够提高软件的开发效率和质量。

Patent Agency Ranking