一种基于域特征分布的跨项目软件缺陷预测方法

    公开(公告)号:CN115269378B

    公开(公告)日:2023-06-09

    申请号:CN202210717461.5

    申请日:2022-06-23

    Applicant: 南通大学

    Abstract: 本发明提供一种基于域特征分布的跨项目软件缺陷预测方法,包括如下步骤:S1、构建项目向量集PVS;S2、构建源域实例候选索引集SDCI;S3、构建源域实例候选集SDCS;S4、构建适应域特征分布索引DFDI;S5、构建适应域特征分布的训练集DFDD;S6、构建基于域特征分布的跨项目软件缺陷预测方法DFDCP。本发明提出一种基于域特征分布的跨项目软件缺陷预测方法,在源域实例候选集中,由目标实例的去均值化向量进行实例再选择,构建适应域特征分布的实例集,使用该方法构建的训练集有利于进一步建立精确的跨项目缺陷预测模型,实现更好的跨项目缺陷预测效果。

    一种用于视网膜病变分类的卷积神经网络权值优化方法

    公开(公告)号:CN110929775B

    公开(公告)日:2022-08-12

    申请号:CN201911127264.2

    申请日:2019-11-18

    Applicant: 南通大学

    Abstract: 本发明涉及到医学信息智能处理领域,具体来说涉及一种用于视网膜病变分类的卷积神经网络权值优化方法。该方法首先获取眼底图像训练集、及其对应的多病变标签;通过单种群蛙跳算法寻找最优初始权值,然后构建卷积神经网络中的卷积层、池化层和全连接层,将最优初始权值作为第一次前向传播计算的参数;将视网膜中四种病变的四个预测值分别与真实值进行交叉熵损失计算并求和得到损失值,判断损失值是否异常,如果异常则围绕前一次前向传播的权值生成蛙群,寻找最优蛙更新网络权值;否则采用梯度下降算法更新网络权值;最后对最终权值进行优化。本发明能有效提高眼底图像多病变检测的准确率,对视网膜疾病和辅助治疗具有较强应用价值。

    基于类实例相似性的源项目选择预测方法

    公开(公告)号:CN114880221A

    公开(公告)日:2022-08-09

    申请号:CN202210490982.1

    申请日:2022-05-07

    Applicant: 南通大学

    Abstract: 本发明属于软件缺陷预测的技术领域,提供一种基于类实例相似性的源项目选择预测方法,包括如下步骤:S1、构建缺陷预测数据集DATA;S2、ST模型处理数据集单元STset;S3、获取类实例相似度数据集SCset;S4、获取源项目选择指标集SMset;S5、构建最相似类实例选择方法SOCImethod;S6、构建基于类实例相似性的源项目选择方法ST‑SIS。本发明沿用K近邻机制进行延伸拓展,以细粒度形式进行软件缺陷预测,可为后续数据训练提供更高质量的源项目,该方法能够有效提高软件缺陷预测效率。

    基于多重源码表示和循环神经网络的代码注释生成方法

    公开(公告)号:CN114816516A

    公开(公告)日:2022-07-29

    申请号:CN202210452163.8

    申请日:2022-04-27

    Applicant: 南通大学

    Abstract: 本发明提供一种基于多重源码表示和循环神经网络的代码注释生成方法,包括如下步骤:S1、收集Java代码注释对,构建语料库;S2、在序列化处理层,将语料库中的源代码转换为token序列、SBT序列和API序列;S3、在编码器层,使用双向GRU作为编码器,为3个序列分别构建codeseq编码器、SBTseq编码器和APIseq编码器,学习源代码不同级别的信息;S4、在解码器层,使用单向GRU构建解码器,并利用teacher forcing策略训练模型;S5、在3个编码器中的每个编码器后添加注意力层,将三个编码器输入和解码器输入的注意力矩阵链接起来并用一个全连接层学习如何组合每个输入的代码,最终输出代码注释。本发明提高代码注释生成的准确性,提高软件开发人员在软件开发过程中的效率,节省开发时间。

    基于语义度量值的源项目选择软件缺陷预测方法

    公开(公告)号:CN114579468A

    公开(公告)日:2022-06-03

    申请号:CN202210276660.7

    申请日:2022-03-21

    Applicant: 南通大学

    Abstract: 本发明提供一种基于语义度量值的源项目选择软件缺陷预测方法,包括如下步骤:S1、使用AST构建源代码的抽象语法树;S2、将抽象语法树转换成向量;S3、计算源代码的语义度量值;S4、融合语义度量值和传统度量值;S5、使用源项目选择策略SPGather对项目集选择;S6、使用迁移学习缩小源域和目标域的数据差异;S7、构建分类模型方法集CMMS;S8、构建基于语义度量值的源项目选择缺陷预测方法BSCPM。本发明提出基于语义度量值的源项目选择软件缺陷预测方法,可以为目标项目选择更好的源项目,该方法有助于提高软件缺陷预测的效率和实现更好的预测效果。

    一种基于递归神经网络模型的代码注释生成方法

    公开(公告)号:CN113190219A

    公开(公告)日:2021-07-30

    申请号:CN202110497846.0

    申请日:2021-05-08

    Applicant: 南通大学

    Abstract: 本发明提供一种基于递归神经网络模型的代码注释生成方法,主要用于解决开发人员节省编写注释所需的时间。包括如下步骤:使用scrapy从开源社区上爬取评分高的代码项目,获得java数据集;对获得的java数据集进行一些筛选和处理,优化数据集;将处理过的数据集输入Seq2Seq+Attention&Copy模型中,进行信息的编码;将输出的信息编码输入Attention机制层和Copy机制层得到上下文向量;将结构信息的编码输出和上下文向量输入解码层,由源代码注释和序列概率分布生成输出序列;基于已训练好的Seq2Seq+Attention&Copy代码注释模型,对代码进行自动注释。本发明中,自动代码注释生成不仅可以帮助开发人员理解源代码,还可以节省编写注释所需的时间。

    基于局部和结构一致性流形GMM的多模态过程监测方法

    公开(公告)号:CN109656202B

    公开(公告)日:2021-07-30

    申请号:CN201811485741.8

    申请日:2018-12-06

    Applicant: 南通大学

    Abstract: 本发明公开了基于局部和结构一致性流形GMM的多模态过程监测方法,利用GMM将多模数据划分成多个局部数据块,分析局部数据块的局部切空间,计算局部切空间之间的主角,研究局部数据块之间的相似关系,构建局部和结构一致性流形图谱,根据不同模态对应子流形的结构关系获取过程模态变化情况,设计一致性流形平滑的监测统计量,实施故障检测。与一般的流形GMM监测方法相比,本发明根据不同高斯成分对应的数据块,获取局部切空间的相似度,并融合局部和结构一致性信息,构建流形学习的图谱,分析多个子流形之间的关系,避免了交叉重叠数据块的错误划分,准确描述多模态过程数据在低维嵌入空间的几何结构,实施精确的故障检测,达到更好的监测效果。

    一种基于联合嵌入模型的代码推荐方法

    公开(公告)号:CN112860879A

    公开(公告)日:2021-05-28

    申请号:CN202110251408.6

    申请日:2021-03-08

    Applicant: 南通大学

    Abstract: 本发明提供一种基于联合嵌入模型的代码推荐方法,包括:S1、从GitHub帖子的评论中提取对问题的补充性问题;S2、将 用来训练sequence‑to‑sequence模型,并保存为问题提升模型;S3、从GitHub上收集带有注释的Java开源项目数据集,并对其预处理;S4、建立联合嵌入模型,进行向量化处理;S5、从GitHub中收集至少有20个stars的Java开源项目来构建代码库,将所有的代码段嵌入到向量中;S6、将查询问题输入到问题提升模型中,将得到的结果输入到联合嵌入模型中进行向量化;S7、计算查询问题的向量和代码向量的相似度得分来推荐Top‑k代码段。本发明解决了自然语言查询中反映的高级意图与源代码中低级实现细节之间不匹配的问题,以及深度学习方法中缺乏不可扩展性的问题。

    一种基于WTP-WCD算法的API推荐方法
    29.
    发明公开

    公开(公告)号:CN112214511A

    公开(公告)日:2021-01-12

    申请号:CN202011078740.9

    申请日:2020-10-10

    Applicant: 南通大学

    Abstract: 本发明提供一种基于WTP‑WCD算法的API推荐方法,包括如下步骤:步骤1)、收集API数据集;步骤2)、对数据集预处理;步骤3)、建立模型,将数据进行向量化处理;步骤4)、对生成的词向量进行加权处理;步骤5)、对需要查询的问题内容同样进行步骤二、三、四处理操作;步骤6)、进行相似度计算。本发明主要用于解决在软件开发中向用户推荐API的问题,能够有效辅助软件开发人员使用API来完成开发任务,具有较高的精确率和效率。本发明不仅可以向用户精确推荐API,而且能有效提高API推荐的效率。

    一种基于演化切片的演化影响集预测方法

    公开(公告)号:CN106844218B

    公开(公告)日:2020-06-23

    申请号:CN201710076573.6

    申请日:2017-02-13

    Applicant: 南通大学

    Abstract: 本发明提供一种基于演化切片的演化影响集预测方法,主要用于构建演化影响集以辅助软件开发者和维护者作出演化策略,包括如下步骤:识别演化元素;生成演化切片准则;构建演化数据依赖图;构建演化控制依赖图;生成演化切片作为演化影响集;度量演化影响集。本发明公开的基于演化切片的演化影响集预测(ESISP)方法具有较高的查全率和较低的存伪率,能有效辅助软件开发人员和维护人员作出相关决策。

Patent Agency Ranking