一种多级特征提取方法
    1.
    发明公开

    公开(公告)号:CN110704308A

    公开(公告)日:2020-01-17

    申请号:CN201910857082.4

    申请日:2019-09-11

    Abstract: 本发明属于软件代码相似度检测技术领域,具体涉及应用于代码相似度检测的一种多级特征提取方法。其特征在于,包括:获取并存储代码库各软件项目的混合特征集合;所述混合特征集合包括表征所述软件项目中各文件夹结构的文件夹级特征、表征所述软件项目中各文件语义的文件级特征、表征所述软件项目中各函数语义和语法的函数级特征、表征所述软件项目中各代码段语法、语义、文本的代码段级特征。在代码库中预先获取并存储代码库中各软件项目全面的混合特征集合,使之可以全面刻画软件项目在文件夹、文件、函数、代码段等多种级别的信息,有力提升了系统的检测精度。在待测软件输入后仅需实时计算代码库特征即可进行比对,提高了比对速度。

    一种多级特征提取方法
    2.
    发明授权

    公开(公告)号:CN110704308B

    公开(公告)日:2022-09-09

    申请号:CN201910857082.4

    申请日:2019-09-11

    Abstract: 本发明属于软件代码相似度检测技术领域,具体涉及应用于代码相似度检测的一种多级特征提取方法。其特征在于,包括:获取并存储代码库各软件项目的混合特征集合;所述混合特征集合包括表征所述软件项目中各文件夹结构的文件夹级特征、表征所述软件项目中各文件语义的文件级特征、表征所述软件项目中各函数语义和语法的函数级特征、表征所述软件项目中各代码段语法、语义、文本的代码段级特征。在代码库中预先获取并存储代码库中各软件项目全面的混合特征集合,使之可以全面刻画软件项目在文件夹、文件、函数、代码段等多种级别的信息,有力提升了系统的检测精度。在待测软件输入后仅需实时计算代码库特征即可进行比对,提高了比对速度。

Patent Agency Ranking