-
公开(公告)号:CN107133176A
公开(公告)日:2017-09-05
申请号:CN201710322848.X
申请日:2017-05-09
Applicant: 武汉大学
CPC classification number: G06F11/3608 , G06K9/6256 , G06K9/6278
Abstract: 本发明涉及一种基于半监督聚类数据筛选的跨项目缺陷预测方法,该方法利用半监督聚类算法对软件模块数据进行聚类发现子簇;随后,收集所有生成的簇中与本项目历史软件模块类标号相同的所有的跨项目历史软件模块即为筛选后的跨项目软件模块数据;最后基于筛选后的跨项目软件模块数据和所有的本项目历史软件模块数据利用朴素贝叶斯分类算法建立跨项目缺陷预测模型,预测待预测的本项目软件模块数据。本发明能够使跨项目软件预测模型避免受到不相关跨项目软件模块数据的影响,充分利用跨项目历史软件模块信息和本项目历史软件模块信息,增强了跨项目软件缺陷预测模型的性能。
-
公开(公告)号:CN107025169A
公开(公告)日:2017-08-08
申请号:CN201710048225.8
申请日:2017-01-20
Applicant: 武汉大学
IPC: G06F11/36
CPC classification number: G06F11/3688
Abstract: 本发明涉及一种基于贝叶斯网络推理的软件错误分层诊断方法,包括构建函数层,MIC理论的应用,提高统计依赖的准确度,改进并应用Laplace平滑策略,解决测试数据稀松性。进行测试预言,判断某测试用例对整个程序是否为失败测试用例。进行错误定位,计算函数的可疑度并排序,构建对应函数的语句层BNPDG,按可疑度排序对函数进行逐一检查,在函数的语句层BNPDG上进行测试预言,找到bug函数,在其语句层BNPDG上进行错误定位,得到函数中所有语句的可疑度排序。按照可疑度排序对语句进行逐一检查,直到找到bug语句。本发明减少了错误诊断的空间消耗和时间消耗。解决了RankCP等技术中计算的局部可疑度存在的问题。
-
公开(公告)号:CN109785409B
公开(公告)日:2020-09-08
申请号:CN201811644583.6
申请日:2018-12-29
Applicant: 武汉大学
Abstract: 本发明公开了一种基于注意力机制的图像‑文本数据融合方法和系统,该方法首先构建基于注意力机制的图像‑文本数据融合网络,并基于特定任务构建完整的训练网络,再利用训练集进行训练,然后将待融合的图像和文本数据输入训练好的数据融合网络中,实现两者的数据融合。具有如下突出的特点和优点:第一,引入位置编码代替循环神经网络对文本上下文进行建模,数据融合网络的可并行化程度更高,训练模型的训练速率更快;第二,通过图像和文本在语义层次上的融合,使得融合后的数据质量更高,可用性更强;第三,该方法可以通过多种任务训练数据融合网络,鲁棒性更强。
-
公开(公告)号:CN107391370B
公开(公告)日:2020-05-12
申请号:CN201710571131.9
申请日:2017-07-13
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于数据过采样和集成学习的软件缺陷数目预测方法,首先利用过采样技术通过增加缺陷数据集中缺陷数目为大于零的软件模块得到相对平衡的新数据集,然后利用相对平衡的缺陷数据集训练出若干个弱的软件缺陷数目预测模型,最后集成这些弱的软件缺陷数目预测模型来预测待预测的软件模块的缺陷数目。本发明的技术方案既能够解决缺陷数据集中数据不平衡的问题,又能够结合多个弱的预测模型来提高软件缺陷数目预测模型的性能。
-
公开(公告)号:CN107391370A
公开(公告)日:2017-11-24
申请号:CN201710571131.9
申请日:2017-07-13
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于数据过采样和集成学习的软件缺陷数目预测方法,首先利用过采样技术通过增加缺陷数据集中缺陷数目为大于零的软件模块得到相对平衡的新数据集,然后利用相对平衡的缺陷数据集训练出若干个弱的软件缺陷数目预测模型,最后集成这些弱的软件缺陷数目预测模型来预测待预测的软件模块的缺陷数目。本发明的技术方案既能够解决缺陷数据集中数据不平衡的问题,又能够结合多个弱的预测模型来提高软件缺陷数目预测模型的性能。
-
公开(公告)号:CN107391369A
公开(公告)日:2017-11-24
申请号:CN201710571098.X
申请日:2017-07-13
Applicant: 武汉大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于数据筛选和数据过采样的跨项目缺陷预测方法,设计了合理的数据筛选和数据不平衡处理策略,利用层次聚类算法筛选出真正和本项目模块数据相似的跨项目历史软件模块数据,使跨项目软件缺陷预测模型避免受到不相关跨项目历史软件模块数据的影响,然后利用过采样方法增加有缺陷的软件模块数据得到分类相对平衡的新数据集,使跨项目软件缺陷预测模型避免受到不平衡的训练数据集的影响。本发明的技术方案具有简单高效的特点,能够较好地提高跨项目软件缺陷预测模型的性能。
-
公开(公告)号:CN107239798A
公开(公告)日:2017-10-10
申请号:CN201710374939.8
申请日:2017-05-24
Applicant: 武汉大学
CPC classification number: G06K9/623 , G06F11/366 , G06K9/6226
Abstract: 本发明针对软件缺陷数据集中不相关特征和冗余特征会降低软件缺陷个数预测模型的性能的问题,提出了一种面向软件缺陷个数预测的特征选择方法。首先利用特征与特征之间的关联性,对特征集进行谱聚类,将相互之间冗余度高的特征聚类到同一个簇中。在聚类的结果中,利用特征与软件缺陷个数之间的相关性,从每个簇中选出相关性最强的几个特征,这样既降低了特征之间的冗余度,又排除了不相关特征,得到最终的有益于缺陷个数预测模型性能的特征子集。本发明的技术方案具有简单、快速的特点,得到的特征子集有助于提高软件缺陷个数预测模型的性能。
-
-
-
-
-
-