-
公开(公告)号:CN117725920A
公开(公告)日:2024-03-19
申请号:CN202311642908.8
申请日:2023-12-01
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F40/284 , G06F40/30 , G06F40/211 , G06F18/214 , G06N3/09 , G06N3/0895
Abstract: 本说明书实施例公开了一种代码变更标签生成方法、装置以及设备,有助于更高效、更可靠、更能满足个性化需求地添加代码变更标签。方案包括:获取代码变更信息集合,以及获取预先定义的标签信息集合;根据所述标签信息集合中包含的标签信息,对所述代码变更信息集合中包含的代码变更信息进行语义比对和代码差异比对特征分析,为所述代码变更信息生成对应的标签;获取利用大规模的自然语言数据和程序语言数据训练过的大语言模型;根据所述代码变更信息及其对应的标签,对所述大语言模型进行微调训练,得到标签生成大语言模型;利用所述标签生成大语言标签生成模型,为目标代码变更信息生成对应的标签。
-
公开(公告)号:CN117707947A
公开(公告)日:2024-03-15
申请号:CN202311696836.5
申请日:2023-12-11
Applicant: 支付宝(杭州)信息技术有限公司
Abstract: 本说明书实施例提供了代码检测模型训练方法及装置,其中,一种代码检测模型训练方法包括:在预训练模型的训练过程中,通过预训练模型对训练样本中包含的检测关键词进行识别,根据识别结果在训练样本中读取代码片段并进行特征提取,针对提取的代码特征进行各个异常类型的异常检测处理获得目标异常类型,生成代码片段在目标异常类型下的异常提示信息并写入代码片段获得输出代码片段,基于输出代码片段和训练样本的样本标签对预训练模型进行参数调整,以此通过对预训练模型的训练获得代码检测模型。
-
公开(公告)号:CN117827173A
公开(公告)日:2024-04-05
申请号:CN202311760461.4
申请日:2023-12-20
Applicant: 支付宝(杭州)信息技术有限公司
IPC: G06F8/30
Abstract: 本说明书实施例提供了标题生成模型训练方法及装置,其中,一种标题生成模型训练方法包括:获取代码合并请求的代码合并数据,在代码合并数据的数据长度大于预设数据长度的情况下,按照压缩优先级对代码合并数据包含的代码描述字段、代码分支字段和代码差异字段至少一者进行压缩处理,获得压缩代码数据,基于压缩代码数据构建训练样本,并根据代码合并请求的标题信息构建样本标签,根据训练样本和样本标签对预训练模型进行训练以获得标题生成模型。
-
-