-
公开(公告)号:CN111797242A
公开(公告)日:2020-10-20
申请号:CN202010611989.5
申请日:2020-06-29
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F16/34 , G06F40/295 , G06F40/284
Abstract: 本发明公开了一种基于代码知识图谱和知识迁移的代码摘要生成方法,所述方法如下:1、抽取并融合多源数据构建代码知识图谱;2、利用代码解析工具生成抽象语法树,遍历抽象语法树中的方法调用节点获取API调用序列;3、从代码知识图谱中搜索API调用序列中的API描述信息;4、挖掘大规模开源项目,构建API序列摘要生成数据集,训练文本摘要生成模型,学习与API功能相关的背景知识;5、构建代码摘要生成模型;6、在代码摘要数据集上训练代码摘要生成模型,并利用该模型生成代码摘要。本发明将代码知识图谱和知识迁移用于代码摘要生成任务,能加强模型提取代码功能语义信息的能力,辅助模型理解代码,提高代码摘要生成质量。
-
公开(公告)号:CN111797242B
公开(公告)日:2023-04-07
申请号:CN202010611989.5
申请日:2020-06-29
Applicant: 哈尔滨工业大学
IPC: G06F16/36 , G06F16/34 , G06F40/295 , G06F40/284
Abstract: 本发明公开了一种基于代码知识图谱和知识迁移的代码摘要生成方法,所述方法如下:1、抽取并融合多源数据构建代码知识图谱;2、利用代码解析工具生成抽象语法树,遍历抽象语法树中的方法调用节点获取API调用序列;3、从代码知识图谱中搜索API调用序列中的API描述信息;4、挖掘大规模开源项目,构建API序列摘要生成数据集,训练文本摘要生成模型,学习与API功能相关的背景知识;5、构建代码摘要生成模型;6、在代码摘要数据集上训练代码摘要生成模型,并利用该模型生成代码摘要。本发明将代码知识图谱和知识迁移用于代码摘要生成任务,能加强模型提取代码功能语义信息的能力,辅助模型理解代码,提高代码摘要生成质量。
-