-
公开(公告)号:CN107844414A
公开(公告)日:2018-03-27
申请号:CN201610854844.1
申请日:2016-09-21
Applicant: 南京大学
IPC: G06F11/36
CPC classification number: G06F11/3692 , G06F11/3696
Abstract: 本发明为一种基于缺陷报告分析的跨项目、并行化缺陷定位方法:首先收集相关的项目及其源代码和缺陷报告,对源代码和缺陷报告分别进行分词、去除停用词、提取词干等文本处理工作;然后采用空间向量模型方法和主题模型方法计算缺陷报告和项目中源代码文件的字词相似度和语义相似度,以改善定位精度;并采用并行化方法来加快计算速度、提升效率;最后采用时间和加速比评估采用并行化方法对缺陷定位和传统串行化方法所提高的时间性能,Top-k准确率(Accuracy@k)和序位倒数均值(MRR)评估采用空间向量模型和主题模型对缺陷定位效果的精度。