一种基于质量过滤器的缺陷报告标题自动生成方法

    公开(公告)号:CN114676298A

    公开(公告)日:2022-06-28

    申请号:CN202210379210.0

    申请日:2022-04-12

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于质量过滤器的缺陷报告标题自动生成方法,属于软件质量保障技术领域。其技术方案为:首先从GitHub上选择高质量开源项目,再对数据集进行数据预处理,训练自动生成模型,当预测新的缺陷报告时,分别基于通过学习低质量缺陷报告特征进行过滤的深度学习模块和通过判断历史数据集中是否存在与新缺陷报告内容相似的数据实现预测的信息检索模块,来协同预测该缺陷报告能否生成高质量标题,若预测能,则通过自动生成模型生成标题,反之则提出警告。本发明的有益效果为:通过使用正则表达式进行数据预处理,提高了数据处理效率和方法的兼容性;通过双模块协同过滤,提高了自动生成模型生成的标题质量与效率。

    一种基于缺陷报告摘要中词性信息的严重程度预测方法

    公开(公告)号:CN113011179A

    公开(公告)日:2021-06-22

    申请号:CN202110341218.3

    申请日:2021-03-30

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于缺陷报告摘要中词性信息的严重程度预测方法,通过使用较少数据量实现相近或更优的预测性能,并进一步地利用软件缺陷报告跟踪系统平台上存放的大型项目所含缺陷报告,进行快速且高准确性的软件缺陷报告严重程度的预测。本发明的有益效果为:本发明预测方法首先对缺陷报告中的摘要属性进行文本预处理,得到词根形式的分词;基于大规模文本语料库使用卷积神经网络模型训练,获得包含所属各分词词性和单词间相似度邻接矩阵的Spacy模型,进一步对分词进行筛选,随机抽取并生成相似数据扩充数据集,最终实现对缺陷报告严重程度的预测,相比于其他预测方法使用较少数据实现了更优性能。

    基于Spacy词向量的两阶段判别缺陷报告严重程度预测方法

    公开(公告)号:CN112306731A

    公开(公告)日:2021-02-02

    申请号:CN202011265113.6

    申请日:2020-11-12

    Applicant: 南通大学

    Abstract: 本发明提供了基于Spacy词向量的两阶段判别缺陷报告严重程度预测方法,首先从项目所在的缺陷跟踪系统中搜集历史缺陷报告,并抽取描述信息summary属性和严重程度severity属性对应内容得到缺陷报告训练数据集,然后进行预处理及生成对应向量,最后执行两阶段判别过程构建严重程度预测模型。本发明的有益效果为:本发明在两阶段判别过程采用朴素贝叶斯算法,该算法易实现、效果好,可保证预测模型的准确率;该发明的严重程度预测模型对相同的数据进行两次运用,一方面实现对同一批数据的二次利用,有利于提升模型的表现;另一方面实现两阶段判别可在大类分类正确的情况下减轻多分类朴素贝叶斯预测模型的压力,进一步提高预测模型的准确率。

Patent Agency Ranking