一种基于双重信息检索的Bash代码注释生成方法

    公开(公告)号:CN113961237B

    公开(公告)日:2024-08-20

    申请号:CN202111220663.0

    申请日:2021-10-20

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于双重信息检索的Bash代码注释生成方法,包括以下步骤:(1)搜集数据得到一个高质量语料库,对该语料库进行去重操作,得到数据集;(2)使用CodeBert提取代码语义特征;(3)将代码片段视为由词元组成的集合,通过文本编辑距离计算集合之间的词法相似度,通过词法相似度从k个候选代码片段中检索出与目标代码词法相似度最高的代码片段;(4)从数据集中检索出与目标代码最相似代码片段,将该代码对应的注释作为目标代码的代码注释。本发明的有益效果为:可以根据目标代码在代码库中检索出最相似代码,从而生成高质量的代码注释,提高Bash代码的可读性和可理解性,帮助开发人员快速理解Bash代码。

    一种基于CodeBERT微调和检索增强的Bash代码注释生成方法

    公开(公告)号:CN114880022B

    公开(公告)日:2024-06-14

    申请号:CN202210469925.5

    申请日:2022-04-28

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于CodeBERT微调和检索增强的Bash代码注释生成方法,属于计算机技术领域,解决了Bash代码开发过程中需要耗费人工成本手动编写注释的问题。其技术方案为:(1)使用构建的数据集对预训练模型CodeBERT进行微调;(2)在代码注释生成阶段,使用构建的双重信息检索方法检索出目标代码的最相似代码;(4)将目标代码和相似代码输入到微调后的CodeBERT编码器中,对得到的两个表征向量经过归一化操作;(5)将两个表征向量输入到融合层得到融合向量;(6)将融合向量输入到解码器中得到代码注释。本发明的有益效果为:快速根据现有Bash代码生成对应注释,提高Bash代码可读性和理解性。

    一种移动应用程序代码提交故障预测模型的可解释性方法

    公开(公告)号:CN114880206A

    公开(公告)日:2022-08-09

    申请号:CN202210038845.4

    申请日:2022-01-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种移动应用程序代码提交故障预测模型的可解释性方法,包括以下步骤:(1)通过挖掘版本控制系统,搜集来自移动应用程序项目内的代码提交,随后对代码提交进行度量和标注,形成数据集;(2)根据数据集,借助随机森林构建出移动应用程序代码提交故障预测模型;(3)当面对新的代码提交时,对该代码提交进行度量,然后输入到代码提交故障预测模型中,得到预测结果;(4)对局部可解释性技术LIME进行超参优化,使用超参优化的LIME方法ExplainApp生成该预测结果的解释。本发明的有益效果为:预测出新的代码提交是否会引入故障,同时可以给出相应的高质量解释,辅助开发人员完成后续故障的理解、定位和修复。

    一种移动应用程序代码提交故障预测模型的可解释性方法

    公开(公告)号:CN114880206B

    公开(公告)日:2024-06-11

    申请号:CN202210038845.4

    申请日:2022-01-13

    Applicant: 南通大学

    Abstract: 本发明提供了一种移动应用程序代码提交故障预测模型的可解释性方法,包括以下步骤:(1)通过挖掘版本控制系统,搜集来自移动应用程序项目内的代码提交,随后对代码提交进行度量和标注,形成数据集;(2)根据数据集,借助随机森林构建出移动应用程序代码提交故障预测模型;(3)当面对新的代码提交时,对该代码提交进行度量,然后输入到代码提交故障预测模型中,得到预测结果;(4)对局部可解释性技术LIME进行超参优化,使用超参优化的LIME方法ExplainApp生成该预测结果的解释。本发明的有益效果为:预测出新的代码提交是否会引入故障,同时可以给出相应的高质量解释,辅助开发人员完成后续故障的理解、定位和修复。

    一种基于CodeBERT微调和检索增强的Bash代码注释生成方法

    公开(公告)号:CN114880022A

    公开(公告)日:2022-08-09

    申请号:CN202210469925.5

    申请日:2022-04-28

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于CodeBERT微调和检索增强的Bash代码注释生成方法,属于计算机技术领域,解决了Bash代码开发过程中需要耗费人工成本手动编写注释的问题。其技术方案为:(1)使用构建的数据集对预训练模型CodeBERT进行微调;(2)在代码注释生成阶段,使用构建的双重信息检索方法检索出目标代码的最相似代码;(4)将目标代码和相似代码输入到微调后的CodeBERT编码器中,对得到的两个表征向量经过归一化操作;(5)将两个表征向量输入到融合层得到融合向量;(6)将融合向量输入到解码器中得到代码注释。本发明的有益效果为:快速根据现有Bash代码生成对应注释,提高Bash代码可读性和理解性。

    一种基于Transformer和混合代码表示的Java代码注释自动生成方法

    公开(公告)号:CN112162775A

    公开(公告)日:2021-01-01

    申请号:CN202011129802.4

    申请日:2020-10-21

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于Transformer和混合代码表示的Java代码注释自动生成方法,包括以下步骤:S1、下载Java项目,构建代码库;S2、在序列化处理层,基于AST遍历转换为代码token向量和SBT向量;S3、在编码层,使用Code编码器和SBT编码器,Code编码器从源代码中提取词法信息,使用SBT编码器来获取代码的结构信息;S4、在解码层,对语义信息进行解码生成注释。本发明的有益效果为:本发明的方法是用于代码注释生成,尤其是在编码层对Code和基于AST的SBT遍历序列进行编码,并合并两者学习的语义信息以捕获源代码的语义信息。

    一种基于双重信息检索的Bash代码注释生成方法

    公开(公告)号:CN113961237A

    公开(公告)日:2022-01-21

    申请号:CN202111220663.0

    申请日:2021-10-20

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于双重信息检索的Bash代码注释生成方法,包括以下步骤:(1)搜集数据得到一个高质量语料库,对该语料库进行去重操作,得到数据集;(2)使用CodeBert提取代码语义特征;(3)将代码片段视为由词元组成的集合,通过文本编辑距离计算集合之间的词法相似度,通过词法相似度从k个候选代码片段中检索出与目标代码词法相似度最高的代码片段;(4)从数据集中检索出与目标代码最相似代码片段,将该代码对应的注释作为目标代码的代码注释。本发明的有益效果为:可以根据目标代码在代码库中检索出最相似代码,从而生成高质量的代码注释,提高Bash代码的可读性和可理解性,帮助开发人员快速理解Bash代码。

    基于对偶学习的shellcode代码和注释生成方法

    公开(公告)号:CN114546397B

    公开(公告)日:2024-08-20

    申请号:CN202210041705.2

    申请日:2022-01-14

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于对偶学习的shellcode代码和注释生成方法,包括以下步骤:(1)搜集来自shellstorm和Exploit Database的shellcode语料库;(2)将shellcode注释生成和shellcode代码生成这两个任务形式化为一个对偶学习问题,并通过为输入添加前缀来区分两个任务,使用浅层的Transformer进行同步学习,实现知识共享,提高训练模型的性能和泛化能力;(3)提出了一种改进自注意力计算的归一化方法Adjust_QKNorm,以使Transformer适应低资源任务;(4)提出一个基于规则的修复组件。本发明的有益效果为:有利于软件的开发和维护,生成的高质量注释和代码可以帮助提高开发人员的工作效率,进而提高软件质量。

    基于Glove和RNN的Stack Overflow论坛问题贴提问目的预测方法

    公开(公告)号:CN114564654A

    公开(公告)日:2022-05-31

    申请号:CN202011564142.2

    申请日:2020-12-25

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于Glove和RNN的Stack Overflow论坛问题贴提问目的预测方法,包括以下步骤:(1)搜集Stack Overflow网站上问题贴的内容,针对内容进行数据预处理,基于Glove模型生成分词对应的词向量;(2)通过分析问题贴的内容,确定提问目的;(3)基于上述构建的语料库,对构建的基于长短期记忆循环网络的RNN模型进行训练,利用结合Adam优化器以及注意力机制attention进行优化,得到问题帖提问目的的预测模型。本发明的有益效果为:该方法以提问目的对帖子进行分类,可以为分析Stack Overflow上的帖子讨论主题增加新的维度,方便开发人员对帖子的搜索和浏览,以起到辅助开发人员寻找解决方案的作用。

    基于对偶学习的shellcode代码和注释生成方法

    公开(公告)号:CN114546397A

    公开(公告)日:2022-05-27

    申请号:CN202210041705.2

    申请日:2022-01-14

    Applicant: 南通大学

    Abstract: 本发明提供了一种基于对偶学习的shellcode代码和注释生成方法,包括以下步骤:(1)搜集来自shellstorm和Exploit Database的shellcode语料库;(2)将shellcode注释生成和shellcode代码生成这两个任务形式化为一个对偶学习问题,并通过为输入添加前缀来区分两个任务,使用浅层的Transformer进行同步学习,实现知识共享,提高训练模型的性能和泛化能力;(3)提出了一种改进自注意力计算的归一化方法Adjust_QKNorm,以使Transformer适应低资源任务;(4)提出一个基于规则的修复组件。本发明的有益效果为:有利于软件的开发和维护,生成的高质量注释和代码可以帮助提高开发人员的工作效率,进而提高软件质量。

Patent Agency Ranking