一种跨指令集架构的二进制函数相似性检查系统及方法

    公开(公告)号:CN113900923B

    公开(公告)日:2024-07-12

    申请号:CN202110936947.3

    申请日:2021-08-16

    Abstract: 本发明属于二进制函数相似性检测技术领域,具体涉及一种基于神经机器翻译模型的跨指令集架构的二进制函数相似性检查方法。该方法是利用神经机器翻译中的Transformer模型,把汇编指令中的操作码或操作数视为单词,基本块视为句子,整个二进制函数视为一个段落。首先通过预处理过程把具有多个执行路径的二进制函数转化为与文本类似的序列结构,然后利用神经机器翻译模型,通过无监督学习自动捕获二进制函数的语义信息,生成函数的嵌入向量,最后使用欧氏距离度量嵌入向量之间的距离来判断函数之间的相似关系。该方法在提高检测的准确率的同时大大提高了检查效率。

    一种跨指令集架构的二进制函数相似性检查系统及方法

    公开(公告)号:CN113900923A

    公开(公告)日:2022-01-07

    申请号:CN202110936947.3

    申请日:2021-08-16

    Abstract: 本发明属于二进制函数相似性检测技术领域,具体涉及一种基于神经机器翻译模型的跨指令集架构的二进制函数相似性检查方法。该方法是利用神经机器翻译中的Transformer模型,把汇编指令中的操作码或操作数视为单词,基本块视为句子,整个二进制函数视为一个段落。首先通过预处理过程把具有多个执行路径的二进制函数转化为与文本类似的序列结构,然后利用神经机器翻译模型,通过无监督学习自动捕获二进制函数的语义信息,生成函数的嵌入向量,最后使用欧氏距离度量嵌入向量之间的距离来判断函数之间的相似关系。该方法在提高检测的准确率的同时大大提高了检查效率。

Patent Agency Ranking