-
公开(公告)号:CN114647418A
公开(公告)日:2022-06-21
申请号:CN202210336803.9
申请日:2022-03-31
Applicant: 南通大学
Abstract: 本发明提供一种树序列化嵌入的软件代码推荐方法,主要用于解决开发过程中出现的代码功能实现问题,包括如下步骤:步骤1、通过解析抽象语法树AST分别将向量化的代码和注释嵌入到向量空间中并计算相似度,建立TCDEnn模型;步骤2、收集java代码,通过AST节点提取进行预处理构建训练集和测试集,用来训练和测试TCDEnn模型;步骤3、收集高质量的java代码,建立代码搜索库,开发人员输入描述查询代码搜素库,对搜索代码库中的AST向量与功能描述向量计算相似度,将相似度值最高的k个代码向量返回给开发人员。本发明可以通过直接描述功能需求的形式得到对应代码,有效节省开发时间,提高开发效率。
-
公开(公告)号:CN114816516A
公开(公告)日:2022-07-29
申请号:CN202210452163.8
申请日:2022-04-27
Applicant: 南通大学
IPC: G06F8/73 , G06F40/289 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种基于多重源码表示和循环神经网络的代码注释生成方法,包括如下步骤:S1、收集Java代码注释对,构建语料库;S2、在序列化处理层,将语料库中的源代码转换为token序列、SBT序列和API序列;S3、在编码器层,使用双向GRU作为编码器,为3个序列分别构建codeseq编码器、SBTseq编码器和APIseq编码器,学习源代码不同级别的信息;S4、在解码器层,使用单向GRU构建解码器,并利用teacher forcing策略训练模型;S5、在3个编码器中的每个编码器后添加注意力层,将三个编码器输入和解码器输入的注意力矩阵链接起来并用一个全连接层学习如何组合每个输入的代码,最终输出代码注释。本发明提高代码注释生成的准确性,提高软件开发人员在软件开发过程中的效率,节省开发时间。
-
公开(公告)号:CN116700780A
公开(公告)日:2023-09-05
申请号:CN202310778652.7
申请日:2023-06-29
Applicant: 南通大学
IPC: G06F8/72 , G06F8/75 , G06F8/33 , G06F40/289
Abstract: 本发明提供一种基于抽象语法树代码表征的代码补全方法,包括:S1、收集Github上开源的代码补全数据集DeepCom,选取Java源代码部分并剔除其对应注释,构建代码语料库;S2、将Java源代码转换为其对应的AST抽象语法树,使用切分遍历算法遍历Java代码的AST,获取切分遍历后的序列;S3、利用预训练GPT‑2模型对代码补全任务进行微调操作,并使用BPE算法对输入的文本序列进行分词;S4、在微调过程中使用FGM算法进行对抗训练,为模型在训练过程中添加扰动,增强模型鲁棒性;S5、在推理解码阶段,模型输入代补全代码,逐个词元生成补全代码序列,直到代码补全完整或出现停止符。本发明可以更好地利用源代码丰富的语法结构和语义信息进行完整代码补全,有效提高代码补全的准确性。
-
公开(公告)号:CN116661797A
公开(公告)日:2023-08-29
申请号:CN202310543114.X
申请日:2023-05-15
Applicant: 南通大学
Abstract: 本发明属于代码补全技术领域,具体涉及一种词元粒度下基于加强Transformer的代码补全方法。本发明包括以下步骤:S1:收集Java代码段,构建代码语料库,将Java源代码展平转换为词元序列形式;S2:对数据使用BPE分词算法,利用子词来编码数据,获得模型所需要的词向量;S3:在模型框架方面,使用TransformerEncoder编码待学习词向量信息,通过TransformerDecoder解码获得待补全结果;S4:使用Talking‑HeadsAttention改进传统Transformer模型使用的Multi‑HeadAttention;S5:在推理解码阶段,使用波束搜索方法生成top5个推荐的补全代码,避免在代码补全阶段推荐列表中出现重复词元。本发明可以更好地利用源代码语义信息进行词元粒度代码补全,该方法能有效提高代码补全的准确性。
-
公开(公告)号:CN118173276A
公开(公告)日:2024-06-11
申请号:CN202410326371.2
申请日:2024-03-21
Applicant: 南通大学
IPC: G16H50/50 , G16H20/00 , G06N20/20 , G06F18/2431
Abstract: 本发明属于机器学习技术领域,具体涉及一种出血性脑卒中临床智能预测方法。本发明包括以下步骤:S1、时间‑血肿扩张风险评定模型建立;S2、时间‑血肿扩张风险评定模型求解;S3、1L1正则化逻辑回归模型建立与求解;S4、基于最优随机森林模型建立与求解;S5、对模型预测结果进行比较,得出最优结果。本发明方法用于预测和优化出血性脑卒中患者的预后和临床决策,对于提高患者的生存率和生活质量非常重要。本发明方法结合患者个人信息、治疗方案和预后等数据,构建一定的智能预测模型,有助于最大程度地提高治疗效果,减轻患者的症状,并改善预后,以及帮助医生明确导致预后不良的危险因素,为临床实践带来显著的进步。
-
-
-
-