-
公开(公告)号:CN117852034B
公开(公告)日:2024-11-19
申请号:CN202311778051.2
申请日:2023-12-20
Applicant: 华中科技大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F21/56 , G06F18/24 , G06F18/213
Abstract: 本发明公开了一种基于大模型特征生成的第三方恶意包检测方法,属于程序包检测领域,该方法利用大语言模型来指导第三方包恶意代码片段的识别和特征的生成,自动生成特征集,不依赖于专家定义的特征,能够有效地克服了现有基于机器学习的检测器的缺点,使得特征集更能反映恶意样本与良性样本的差异,拓展性更强;采用更新提示轮询的方式并构建恶意片段集,使准确度得到提高;同时能显著降低恶意包检测的误报率和漏报率,并给出恶意代码位置。
-
公开(公告)号:CN117852034A
公开(公告)日:2024-04-09
申请号:CN202311778051.2
申请日:2023-12-20
Applicant: 华中科技大学 , 支付宝(杭州)信息技术有限公司
IPC: G06F21/56 , G06F18/24 , G06F18/213
Abstract: 本发明公开了一种基于大模型特征生成的第三方恶意包检测方法,属于程序包检测领域,该方法利用大语言模型来指导第三方包恶意代码片段的识别和特征的生成,自动生成特征集,不依赖于专家定义的特征,能够有效地克服了现有基于机器学习的检测器的缺点,使得特征集更能反映恶意样本与良性样本的差异,拓展性更强;采用更新提示轮询的方式并构建恶意片段集,使准确度得到提高;同时能显著降低恶意包检测的误报率和漏报率,并给出恶意代码位置。
-
公开(公告)号:CN110245496A
公开(公告)日:2019-09-17
申请号:CN201910447971.3
申请日:2019-05-27
Applicant: 华中科技大学 , 深圳华中科技大学研究院
Abstract: 本发明公开了一种源代码漏洞检测方法及检测器和其训练方法及系统,包括:基于源代码中的每个函数生成一个抽象语法树,遍历所有抽象语法树,搜集能匹配到同一种漏洞语法特征的代码元素,将代码元素称为候选漏洞元素,确定所有候选漏洞元素;基于程序切片技术,在源代码中识别出与每个候选漏洞元素有语义关联的代码语句,以确定对应的候选漏洞代码段,并为每个候选漏洞代码段添加漏洞标签;将每个候选漏洞代码段对应的向量数据输入到神经网络模型中,并基于每个候选漏洞代码段的标签训练所述神经网络模型,得到漏洞检测器。本发明基于深度神经网络,采用通用的框架提取漏洞语法特征,不局限于漏洞类型,可扩展性强。
-
公开(公告)号:CN110222512A
公开(公告)日:2019-09-10
申请号:CN201910423893.3
申请日:2019-05-21
Applicant: 华中科技大学 , 深圳华中科技大学研究院
Abstract: 本发明公开了一种基于中间语言的软件漏洞智能检测与定位方法与系统,属于漏洞检测领域。包括:分别将训练程序源码和目标源码转化为中间语言程序切片,其包含与可疑漏洞元素相关的代码;若训练程序源码对应的中间语言程序切片包含已知漏洞代码,为其添加“有漏洞”标签并记录其在切片中的位置;否则,为其添加“无漏洞”标签;训练基于样本差异性的循环神经网络;使用训练好的基于样本差异性的循环神经网络,对目标程序源码对应的中间语言程序切片进行漏洞智能检测与定位。本发明使用中间语言切片作为漏洞检测的单位,提高检测准确率。循环神经网络的输出序列中只选取已知漏洞行对应数据参与正向传播,从而使训练好的模型能够识别出漏洞行。
-
公开(公告)号:CN110245496B
公开(公告)日:2021-04-20
申请号:CN201910447971.3
申请日:2019-05-27
Applicant: 华中科技大学 , 深圳华中科技大学研究院
Abstract: 本发明公开了一种源代码漏洞检测方法及检测器和其训练方法及系统,包括:基于源代码中的每个函数生成一个抽象语法树,遍历所有抽象语法树,搜集能匹配到同一种漏洞语法特征的代码元素,将代码元素称为候选漏洞元素,确定所有候选漏洞元素;基于程序切片技术,在源代码中识别出与每个候选漏洞元素有语义关联的代码语句,以确定对应的候选漏洞代码段,并为每个候选漏洞代码段添加漏洞标签;将每个候选漏洞代码段对应的向量数据输入到神经网络模型中,并基于每个候选漏洞代码段的标签训练所述神经网络模型,得到漏洞检测器。本发明基于深度神经网络,采用通用的框架提取漏洞语法特征,不局限于漏洞类型,可扩展性强。
-
公开(公告)号:CN110222512B
公开(公告)日:2021-04-20
申请号:CN201910423893.3
申请日:2019-05-21
Applicant: 华中科技大学 , 深圳华中科技大学研究院
Abstract: 本发明公开了一种基于中间语言的软件漏洞智能检测与定位方法与系统,属于漏洞检测领域。包括:分别将训练程序源码和目标源码转化为中间语言程序切片,其包含与可疑漏洞元素相关的代码;若训练程序源码对应的中间语言程序切片包含已知漏洞代码,为其添加“有漏洞”标签并记录其在切片中的位置;否则,为其添加“无漏洞”标签;训练基于样本差异性的循环神经网络;使用训练好的基于样本差异性的循环神经网络,对目标程序源码对应的中间语言程序切片进行漏洞智能检测与定位。本发明使用中间语言切片作为漏洞检测的单位,提高检测准确率。循环神经网络的输出序列中只选取已知漏洞行对应数据参与正向传播,从而使训练好的模型能够识别出漏洞行。
-
公开(公告)号:CN116663019B
公开(公告)日:2023-10-24
申请号:CN202310823880.1
申请日:2023-07-06
Applicant: 华中科技大学
IPC: G06F21/57 , G06F21/56 , G06F18/214 , G06F18/20 , G06N3/0464 , G06N3/08 , G06N7/01
Abstract: 本发明公开了一种源代码漏洞检测方法、装置和系统,属于信息安全技术领域,所述方法包括:对训练集中代码片段进行静态分析获取对应的增强AST,并将其转化为其状态概率矩阵对应的灰度图像;利用训练集中代码片段对应的灰度图像训练原始CNN模型,得到目标CNN模型;将待检测源代码转化为其增强AST对应的状态概率矩阵的灰度图像;将待检测源代码对应的灰度图像输入目标CNN模型,得到漏洞检测结果。本申请对代码进行静态检测并进一步实现AST扩展,可以较为完整且全面的保留程序的语法和语义信息;在保留程序结构信息的同时将AST转化为图片的形式来表示方式,进而利用训练好的CNN模型进行漏洞检测,能够提升检测效率,还能够支持多程序语言。
-
公开(公告)号:CN113501647B
公开(公告)日:2022-08-02
申请号:CN202110861658.1
申请日:2021-07-29
Applicant: 华中科技大学
IPC: C02F11/10 , C02F11/143 , C10B53/00 , C10B57/00 , C08H7/00
Abstract: 本发明属于污泥资源化处理处置领域,公开了一种定向催化污泥热解油转化水溶性腐植酸的方法,该方法是对原料市政污泥基于Fenton法或类Fenton法经调理、脱水后得到污泥泥饼,接着进行热解处理,利用调理剂中存在的过渡金属元素在热解反应过程产生纳米氧化物颗粒,提高生物炭的产率、降低热解油的产量、同时促进热解油定向转化成水溶性腐植酸物质。本发明通过对方法整体流程工艺设计等进行改进,利用过渡金属在热解过程中充当催化剂,促进C的沉积和芳香化过程,降低热解油的产率并转化污泥热解油的组分为水溶性物质,促进热解油定向转化水溶性腐植酸物质,如此便能够降低热解油的黏度,降低热解油的危害,具有显著的环境效益。
-
公开(公告)号:CN112989358B
公开(公告)日:2022-07-01
申请号:CN202110263311.7
申请日:2021-03-10
Applicant: 华中科技大学
Abstract: 本发明涉及一种提高基于深度学习的源代码漏洞检测健壮性的方法及装置,装置至少包括代码变换模块、映射模块和神经网络模块,映射模块与代码变换模块、映射模块和神经网络模块分别建立数据连接关系,神经网络模块包括至少两个第一分类器,代码变换模块基于接收的第一训练程序源码以代码变换的方式生成具有可攻击性的第二训练程序源码,映射模块将由第二训练程序源码分离形成的若干代码片段映射为第二样本向量,神经网络模块基于与第一训练程序源码对应的第一样本向量和与第二训练程序源码对应的第二样本向量训练至少两个第一分类器直至训练数据达到训练阈值。本发明通过对特征生成器和分类器进行分类训练,提高了源代码漏洞检测健壮性。
-
公开(公告)号:CN109657473B
公开(公告)日:2020-09-18
申请号:CN201811340404.X
申请日:2018-11-12
Applicant: 华中科技大学
IPC: G06F21/57 , G06F40/211 , G06F16/35 , G06N3/04
Abstract: 本发明公开了一种基于深度特征的细粒度漏洞检测方法,其步骤包括以下两个阶段:训练阶段和检测阶段。训练阶段包含:收集大量的有漏洞和无漏洞的程序;对这些程序进行预处理,并从程序依赖图中提取出程序切片;对生成的程序切片按照漏洞类型打上标签;按照安全分析规则,从程序切片中提取出程序关注点;将程序切片和程序关注点转化成向量;搭建基于深度学习的漏洞检测模型,用向量训练模型参数至最优;最终得到一个训练完备的基于深度学习的漏洞检测模型。检测阶段包含:按照训练阶段的源码处理方式,从待测程序中提取程序切片和程序关注点并分别将其转化为向量;利用训练好的漏洞检测模型对向量进行分类,最后根据分类结果生成漏洞检测报告。
-
-
-
-
-
-
-
-
-