-
公开(公告)号:CN112596736B
公开(公告)日:2021-10-08
申请号:CN202011552657.0
申请日:2020-12-24
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于语义的跨指令架构二进制代码相似性检测方法。本发明涉及漏洞检测技术领域,本发明构建不同指令架构的汇编语言数据集,提取具有相同语义的不同指令架构的汇编代码对;对汇编代码基本块对进行归一化处理;进行汇编代码编码器的预训练,将汇编代码语义相似性任务转化为自然语言神经机器翻译任务;进行负采样结合字符串语义的基本块嵌入,将字符串嵌入向量与嵌入网络获得的嵌入向量进行对齐并拼接,组成新的基本块嵌入向量;嵌入网络的训练,输出x86和ARM的嵌入向量;进行二进制代码相似性比较,判断两个不同指令架构的二进制代码是否相似,本发明可以加快漏洞检测、版权纠纷等需要比较不同指令架构基本块的准确率和效率。
-
公开(公告)号:CN112596736A
公开(公告)日:2021-04-02
申请号:CN202011552657.0
申请日:2020-12-24
Applicant: 哈尔滨工业大学
Abstract: 本发明是一种基于语义的跨指令架构二进制代码相似性检测方法。本发明涉及漏洞检测技术领域,本发明构建不同指令架构的汇编语言数据集,提取具有相同语义的不同指令架构的汇编代码对;对汇编代码基本块对进行归一化处理;进行汇编代码编码器的预训练,将汇编代码语义相似性任务转化为自然语言神经机器翻译任务;进行负采样结合字符串语义的基本块嵌入,将字符串嵌入向量与嵌入网络获得的嵌入向量进行对齐并拼接,组成新的基本块嵌入向量;嵌入网络的训练,输出x86和ARM的嵌入向量;进行二进制代码相似性比较,判断两个不同指令架构的二进制代码是否相似,本发明可以加快漏洞检测、版权纠纷等需要比较不同指令架构基本块的准确率和效率。
-