-
公开(公告)号:CN116909574A
公开(公告)日:2023-10-20
申请号:CN202311154532.6
申请日:2023-09-08
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F8/41 , G06F16/33 , G06F40/194
Abstract: 本发明提供了一种检索增强的结构化代码生成系统及方法,该结构化代码生成系统包括检索前处理模块、结构信息提取模块和代码生成融合模块,所述检索前处理模块根据自然语言描述来检索到功能相关的代码片段;所述结构信息提取模块对所述检索前处理模块检索到的代码片段进行结构信息的提取;所述代码生成融合模块将输入的自然语言和代码片段进行融合,完成代码生成任务。本发明的有益效果是:本发明在不改变原有模型规模的条件下,增强其泛化性,提升代码生成的能力。
-
公开(公告)号:CN119248289B
公开(公告)日:2025-05-16
申请号:CN202411775766.7
申请日:2024-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F8/41
Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。
-
公开(公告)号:CN119248289A
公开(公告)日:2025-01-03
申请号:CN202411775766.7
申请日:2024-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F8/41
Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。
-
-