一种利用结构信息的二进制代码克隆检测方法和系统

    公开(公告)号:CN118409787A

    公开(公告)日:2024-07-30

    申请号:CN202310424626.4

    申请日:2023-04-19

    Abstract: 本发明涉及代码克隆检测技术领域,具体涉及一种利用结构信息的二进制代码克隆检测方法和系统;所述方法包括获取软件程序,进行反编译得到二进制代码指令序列,并对二进制代码指令序列提取出基本块和基本块间的结构信息;对二进制代码指令序列、基本块分别进行预处理;对预处理后的二进制代码指令序列和基本块中的各个指令通过预先训练好的词向量模型表征为词向量,得到词向量序列;将词向量序列和结构信息输入到预先训练好的深度学习模型中,提取出语义特征向量;计算出目标软件程序的语义特征向量与其他软件程序的语义特征向量间的相似度距离,根据相似度距离判断所述目标软件程序是否为代码克隆。本发明能够充分检测出软件代码是否为克隆代码。

Patent Agency Ranking