一种代码相似度检测方法

    公开(公告)号:CN117609005B

    公开(公告)日:2024-08-13

    申请号:CN202311359831.3

    申请日:2023-10-19

    Abstract: 本发明公开的属于代码相似度检测技术领域,具体为一种代码相似度检测方法,包括具体步骤如下:构建待相似度检测的源代码对及其相似度标签,通过代码分析工具对源代码对进行解析生成AST、CFG和函数的调用关系,然后根据函数的调用关系,在AST和CFG相应的节点上添加函数调用边,并使用词嵌入技术将AST和CFG的节点转化为向量表示,本发明可以更全面的提取代码信息,提升对代码的相似度检测能力;本发明同时使用含函数调用关系的AST和CFG进行代码相似度检测,可以更全面的提取代码信息,能从语法和语义两方面提取源代码的特征,弥补了现有基于AST或CFG的相似度检测方法对源代码特征提取不充分的问题。

    一种代码相似度检测方法
    4.
    发明公开

    公开(公告)号:CN117609005A

    公开(公告)日:2024-02-27

    申请号:CN202311359831.3

    申请日:2023-10-19

    Abstract: 本发明公开的属于代码相似度检测技术领域,具体为一种代码相似度检测方法,包括具体步骤如下:构建待相似度检测的源代码对及其相似度标签,通过代码分析工具对源代码对进行解析生成AST、CFG和函数的调用关系,然后根据函数的调用关系,在AST和CFG相应的节点上添加函数调用边,并使用词嵌入技术将AST和CFG的节点转化为向量表示,本发明可以更全面的提取代码信息,提升对代码的相似度检测能力;本发明同时使用含函数调用关系的AST和CFG进行代码相似度检测,可以更全面的提取代码信息,能从语法和语义两方面提取源代码的特征,弥补了现有基于AST或CFG的相似度检测方法对源代码特征提取不充分的问题。

Patent Agency Ranking