一种基于机器学习的代码评审意见质量评估系统及方法

    公开(公告)号:CN113326376A

    公开(公告)日:2021-08-31

    申请号:CN202110593291.X

    申请日:2021-05-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于机器学习的自动代码评审意见质量评估方法,本方法包括:评估准则的建立、数据收集及处理、模型架构及训练、模型维护;以及公开了一种基于该评估方法构建的交互式代码评审意见质量评估系统,所述系统包含由收集管理标注数集或未标注数据集的数据管理模块;收集管理预训练模型或分类模型的模型管理模块;对模型进行训练、预训练的模型训练模块及对单条数据或数据文件进行推理的数据推理模块构成;本发明不仅消除了代码评审意见质量评估中的主观性与不一致性,还实现了高精度高效率的代码评审质量评估过程自动化,提高了代码评审活动的效率。

    一种持续集成及部署结果的优化预测方法

    公开(公告)号:CN111367798B

    公开(公告)日:2021-05-28

    申请号:CN202010129434.7

    申请日:2020-02-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种持续集成及部署结果的优化预测方法。本方法包括:专门用于预测持续集成及部署结果的特征集合;利用构建日志和代码提交日志度量集合中的特征的方法;包含备选采样器和备选分类器,以及结合采样器和分类器,利用根据特征集合所构建的样本集训练的用于预测集成及部署结果的模型池;根据自定义的构建频率阈值,利用优化算法从模型池中选择效率最优模型;利用效率最优模型预测持续集成及部署结果,若结果为通过则不执行脚本,若结果为失败则执行脚本。本发明实现了准确预测持续集成及部署结果,以满足软件开发团队对构建频率的具体要求,达到降低实施持续集成及部署的成本、提高生产效率的目的。

    一种持续集成及部署结果的优化预测方法

    公开(公告)号:CN111367798A

    公开(公告)日:2020-07-03

    申请号:CN202010129434.7

    申请日:2020-02-28

    Applicant: 南京大学

    Abstract: 本发明公开了一种持续集成及部署结果的优化预测方法。本方法包括:专门用于预测持续集成及部署结果的特征集合;利用构建日志和代码提交日志度量集合中的特征的方法;包含备选采样器和备选分类器,以及结合采样器和分类器,利用根据特征集合所构建的样本集训练的用于预测集成及部署结果的模型池;根据自定义的构建频率阈值,利用优化算法从模型池中选择效率最优模型;利用效率最优模型预测持续集成及部署结果,若结果为通过则不执行脚本,若结果为失败则执行脚本。本发明实现了准确预测持续集成及部署结果,以满足软件开发团队对构建频率的具体要求,达到降低实施持续集成及部署的成本、提高生产效率的目的。

    一种追踪引入缺陷提交的方法、系统及设备

    公开(公告)号:CN113326189A

    公开(公告)日:2021-08-31

    申请号:CN202110586956.4

    申请日:2021-05-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种追踪引入缺陷提交的方法、系统及设备,根据代码托管平台提供的Api接口获取项目的Issue列表;遍历Issue列表获取合入请求,获取解决该Issue的提交;同步本地Git库和远程Git库,使用本地库获取按时间倒序规则排序好提交的Sha值;遍历修复缺陷的提交数组,对于其中的每一个提交,使用“show”命令获取提交的具体改动行;使用“blame”命令根据改动文件路径以及改动行获取改动行的最近一次修改,改动行的最近一次修改所属提交为嫌疑致陷提交;将嫌疑致陷提交的创建时间与对应Issue的创建时间对比,确定真正的致陷提交。实现了在软件开发过程中根据代码托管平台和版本控制工具,准确识别引入缺陷的提交,方便了团队的管理和对软件质量的相关研究。

    一种基于随机森林分类器的代码评审人推荐系统及方法

    公开(公告)号:CN111428142B

    公开(公告)日:2023-07-28

    申请号:CN202010373726.5

    申请日:2020-05-06

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于随机森林分类器的代码评审人推荐系统及方法,本系统包括:输入模块、计算模块、模型训练模块、推荐结果输出模块,同时提出一种基于随机森林分类器的代码评审人推荐方法,包括输入项目历史代码评审记录;根据历史代码评审记录,挖掘人员活跃度、代码变更和文件权重特征;以项目历史评审记录的评审人作为分类标签,将计算好的特征向量作为数据集,将训练集输入随机森林模型中训练分类模型;从待评审代码变更中抽取特征,输入分类器,输出概率最高的N个类别作为推荐评审人。本发明实现了在大型项目中,根据历史评审记录,为待评审代码变更推荐合适的评审人,为评审人选择提供参考依据并节约沟通成本。

Patent Agency Ranking