一种基于预训练的恶意代码分类方法及装置

    公开(公告)号:CN117332419B

    公开(公告)日:2024-02-20

    申请号:CN202311610887.1

    申请日:2023-11-29

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于预训练的恶意代码分类方法及装置,其中的方法首先提取恶意代码中的浅层特征和subroutine中的操作码,构建特征集;然后构建改进的预训练模型并进行预训练任务,通过训练得到最终模型;最后将待测代码输入到最终模型中,得到类别概率分布,选择具有最高概率的类别作为最终的预测结果。本发明首先提取恶意代码中subroutine的操作码序列,然后提取了TF‑IDF和Asm2Vec的浅层特征。将subroutine用于预训练模型的输入样本进行预训练,可以提升模型的泛化能力,提高模型的训练速度和效果。使用浅层特征作为prefix,既能减少模型训练过程中需要训练的参数规模,又能提升预训练模型的通用性,实现与预训练‑微调范式相当的性能。

    一种基于预训练的恶意代码分类方法及装置

    公开(公告)号:CN117332419A

    公开(公告)日:2024-01-02

    申请号:CN202311610887.1

    申请日:2023-11-29

    Applicant: 武汉大学

    Abstract: 本发明公开了一种基于预训练的恶意代码分类方法及装置,其中的方法首先提取恶意代码中的浅层特征和subroutine中的操作码,构建特征集;然后构建改进的预训练模型并进行预训练任务,通过训练得到最终模型;最后将待测代码输入到最终模型中,得到类别概率分布,选择具有最高概率的类别作为最终的预测结果。本发明首先提取恶意代码中subroutine的操作码序列,然后提取了TF‑IDF和Asm2Vec的浅层特征。将subroutine用于预训练模型的输入样本进行预训练,可以提升模型的泛化能力,提高模型的训练速度和效果。使用浅层特征作为prefix,既能减少模型训练过程中需要训练的参数规模,又能提升预训练模型的通用性,实现与预训练‑微调范式相当的性能。

    用于辅助机器人在室内环境中移动的视觉导航方法和装置

    公开(公告)号:CN118605504A

    公开(公告)日:2024-09-06

    申请号:CN202410545301.6

    申请日:2024-05-06

    Applicant: 武汉大学

    Abstract: 本公开提供一种用于辅助机器人在室内环境中移动的视觉导航方法和装置,其中方法包括:获取表征机器人在室内环境中搜寻的目标对象的目标信息,以及机器人在当前时刻采集的关于目标对象的室内环境图像;将目标信息以及室内环境图像输入预先训练的神经网络模型,得到预先训练的神经网络模型输出的动作预测值;基于动作预测值,确定机器人在当前时刻将要执行的下一步动作;将表征下一步动作的控制指令,发送给机器人的驱动端,以使得驱动端根据控制指令驱动机器人朝向目标对象移动;其中,预先训练的神经网络模型包括自适应关系图、动作增强单元、长短期记忆网络以及图注意力网络。利用本公开的方法,可提高机器人在室内环境中移动的视觉导航效果。

    一种基于扩展代码的深度学习代码搜索模型的加速方法

    公开(公告)号:CN117349453B

    公开(公告)日:2024-02-23

    申请号:CN202311645652.6

    申请日:2023-12-04

    Applicant: 武汉大学

    Abstract: 索。本发明能实现对深度学习代码搜索的加速工本发明提供一种基于扩展代码的深度学习 作。代码搜索模型的加速方法,属于代码搜索技术领域,包括:获取数据集中带有描述的代码,执行预处理;将代码与其对应的描述作为模型的输入和标签,对大规模预训练模型进行微调;使用微调后的模型对待搜索的代码库中的每条代码生成扩展描述,将生成的扩展描述添加到对应代码之后得到扩展后的序列,重复该步骤将代码库扩展为代码+扩展描述库;使用Lucene对代码+扩展描述库进行索引;在线搜索阶段,输入查询语句,使

    一种基于结构位置感知的代码自动摘要方法

    公开(公告)号:CN117407051A

    公开(公告)日:2024-01-16

    申请号:CN202311701689.6

    申请日:2023-12-12

    Applicant: 武汉大学

    Abstract: 本发明提供一种基于结构位置感知的代码自动摘要方法,属于代码自动摘要技术领域,包括:对源代码进行解析获得标记序列和抽象语法树AST,并通过源代码的AST得到源代码的距离关系矩阵;将标记序列和距离关系矩阵传入到注意力模块中;编码器的输出结果作为最后的编码输出;解码器输入编码器输出和起始标识符;解码器依据编码向量和上一时刻的输出逐步生成代码摘要。本发明通过将距离关系矩阵和代码标记序列同时加入注意力计算模块,使得模型同时关注代码各个标记之间的语义和语法关联度,并根据关联度来做更好的特征融合,在注意力计算中添加了距离关系矩阵,使得模型同时关注源代码的语义和语法特征并增强了模型捕获源代码语法信息的能力。

    一种基于特征融合的代码克隆检测方法

    公开(公告)号:CN115373737B

    公开(公告)日:2023-05-26

    申请号:CN202210799752.3

    申请日:2022-07-06

    Applicant: 武汉大学

    Abstract: 本发明涉及语义克隆代码技术领域,涉及一种基于特征融合的代码克隆检测方法,包括:一、训练阶段,使用来自数据集中已经给定标签的成对的克隆代码,执行预处理步骤;二、将代码块编译为Java字节码文件;三、利用字节码依赖图BDG、抽象语法树AST和程序控制依赖图PDG特征分别对给定的代码块生成低级别和高级别特征,并选取一种特征融合方式来对两个目标代码块的特征向量进行融合;对于所有能够进行处理的代码对均进行处理,创建一个训练数据集;四、测试阶段,执行相同的步骤,通过两个给定的代码块创建一个融合的特征向量,通过分类器预测可能的克隆类型。本发明能较佳地进行代码克隆检测。

    一种基于特征融合的代码克隆检测方法

    公开(公告)号:CN115373737A

    公开(公告)日:2022-11-22

    申请号:CN202210799752.3

    申请日:2022-07-06

    Abstract: 本发明涉及语义克隆代码技术领域,涉及一种基于特征融合的代码克隆检测方法,包括:一、训练阶段,使用来自数据集中已经给定标签的成对的克隆代码,执行预处理步骤;二、将代码块编译为Java字节码文件;三、利用字节码依赖图BDG、抽象语法树AST和程序控制依赖图PDG特征分别对给定的代码块生成低级别和高级别特征,并选取一种特征融合方式来对两个目标代码块的特征向量进行融合;对于所有能够进行处理的代码对均进行处理,创建一个训练数据集;四、测试阶段,执行相同的步骤,通过两个给定的代码块创建一个融合的特征向量,通过分类器预测可能的克隆类型。本发明能较佳地进行代码克隆检测。

Patent Agency Ranking