结合软件制品过程信息和文本相似度的制品自动追踪方法

    公开(公告)号:CN111460401A

    公开(公告)日:2020-07-28

    申请号:CN202010431048.3

    申请日:2020-05-20

    Applicant: 南京大学

    Abstract: 本发明属于计算机技术领域,具体涉及一种结合软件制品过程信息和文本相似度的制品自动追踪方法,包括:选择制品,挖掘待关联制品间的追踪关系,划分显隐式追踪关系;抽取待关联制品的过程信息;计算待关联制品间的文本相似度;为显式追踪关系的制品选定过程特征及关系结果标签;隐式追踪关系的制品间的追踪关系人工打标签,并借助中间制品增加相关特征;预处理数据,获取样本集,选择机器学习分类算法,训练模型,预测制品间是否存在追踪关系。本发明从过程数据出发,解决了信息检索方法受限于文本质量以及词汇失配的问题,且可以追踪多种制品间的追踪关系。本发明相较于传统依赖文本相似度的信息检索方法,精确率和召回率均有大幅度提升。

    一种基于随机森林分类器的代码评审人推荐系统及方法

    公开(公告)号:CN111428142A

    公开(公告)日:2020-07-17

    申请号:CN202010373726.5

    申请日:2020-05-06

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于随机森林分类器的代码评审人推荐系统及方法,本系统包括:输入模块、计算模块、模型训练模块、推荐结果输出模块,同时提出一种基于随机森林分类器的代码评审人推荐方法,包括输入项目历史代码评审记录;根据历史代码评审记录,挖掘人员活跃度、代码变更和文件权重特征;以项目历史评审记录的评审人作为分类标签,将计算好的特征向量作为数据集,将训练集输入随机森林模型中训练分类模型;从待评审代码变更中抽取特征,输入分类器,输出概率最高的N个类别作为推荐评审人。本发明实现了在大型项目中,根据历史评审记录,为待评审代码变更推荐合适的评审人,为评审人选择提供参考依据并节约沟通成本。

    一种基于目标模型的日志记录和错误分析工具

    公开(公告)号:CN111258792A

    公开(公告)日:2020-06-09

    申请号:CN201910158658.8

    申请日:2019-03-01

    Applicant: 南京大学

    Abstract: 一个基于目标模型的日志记录和错误分析工具(即JLLAP),由两部分组成,Log Lint和Log Analyzer,设计为Intellij IDEA的插件,在实时模式下工作。此工具将日志记录和日志分析实践将组成一个闭环,其中日志规范化记录提供高质量日志以改进日志分析,而日志分析结果反过来促进日志记录的规范化。

    一种基于目标驱动的软件开发过程知识管理方法

    公开(公告)号:CN102436382A

    公开(公告)日:2012-05-02

    申请号:CN201110419846.5

    申请日:2011-12-14

    Applicant: 南京大学

    Abstract: 一种基于目标驱动的软件开发过程知识管理方法,在软件开发时通过目标驱动和演化步骤,1)目标驱动:目标驱动描述了知识的组织形式;所述方案建立树形的目标组织形式,有助于机构建立结构化的知识管理框架;2)循环演化:循环演化描述了知识的演化方式;循环的性质有助于充实、完善和淘汰过时的知识和经验;每经过一个知识发展周期,知识就被精化一次;借助文本分类算法,有效的知识被补充,相近或重复的知识被合并,而过期的知识则被淘汰。

Patent Agency Ranking