一种基于抽象语法树通路上下文的程序代码相似性度量方法

    公开(公告)号:CN113434145A

    公开(公告)日:2021-09-24

    申请号:CN202110642424.8

    申请日:2021-06-09

    Inventor: 江波 张挺 匡新

    Abstract: 本发明公开了一种基于抽象语法树通路上下文的代码相似性度量方法,所述方法具体包括以下步骤:对程序代码片段进行解析,得到相应的抽象语法树;对上述获得的抽象语法树进行遍历,提取抽象语法树终端节点之间的通路上下文的编码:对上述获得的抽象语法树终端节点之间的通路进行编码,实现向量化代码片段的相似性度量:将上述获得的代码向量,用余弦相似性进行代码的相似性比较。本发明方法可面向Python、Java等语言,基于抽象语法树通路上下文的代码相似性度量方法,解决了目前存在的缺乏兼顾程序代码的结构与语义两方面的程序表示技术的问题。

Patent Agency Ranking