基于学习算法实现缺陷修复推荐的方法

    公开(公告)号:CN110442514B

    公开(公告)日:2024-01-12

    申请号:CN201910623765.3

    申请日:2019-07-11

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于学习算法实现缺陷修复推荐的方法,包括以下步骤:针对收集的bug修复前和修复后的源代码,分别通过GumTree进行抽象语法树AST提取,获得bug修复前、修复后代码各自的AST编辑操作序列;对AST编辑操作序列进行筛选过滤;结合筛选过滤后的AST编辑操作序列,利用解析器抽象bug修复前和修复后的源代码,并分别映射为向量特征表示;根据映射后的向量特征表示训练神经网络,获得缺陷语句识别模型,由此识别出缺陷语句;基于源代码的语义特征为识别出的缺陷语句推荐修复方案。本发明方法根据代码之间的AST编辑操作,通过细粒度的代码分析实现模型特征表示,并联系上下文关系对缺陷代码进行定位,能获得具有细粒度性质的修复推荐方案,使得修复更加准确。

    一种基于近邻保持典型相关分析的人脸识别方法

    公开(公告)号:CN111611963B

    公开(公告)日:2023-12-26

    申请号:CN202010473892.2

    申请日:2020-05-29

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于近邻保持典型相关分析的人脸识别方法,其包括以下步骤:1:输入人脸训练数据集X∈Rm×N,Y∈Rn×N,通过近邻保持学习计算图像的近邻权重重建矩阵Ux和Uy;2:采用典型相关分析寻找两组投影向量wx和wy,用最优化方法将近邻保持引入典型相关分析的框架之中,利用广义特征值分解计算投影矩阵Wx和Wy;3:采用两种特征融合策略对测试人脸图像的低维投影#imgabs0#和#imgabs1#进行融合;4:利用最近邻分类器将融合后的特征用于人脸识别。本发明通过近邻保持学习人脸邻近权重重建矩阵,用最优化方法将近邻保持引入典型相关分析框架中,再利用人脸的标签信息,这样提取出的人脸特征不仅最大化了不同人脸间的相关性,而且还最大可能地保持了人脸的邻域结构,提高了人脸识别能力和稳定性。

    基于源代码图表示学习的智能合约多漏洞检测方法及系统

    公开(公告)号:CN113360915B

    公开(公告)日:2023-09-26

    申请号:CN202110643307.3

    申请日:2021-06-09

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于源代码图表示学习的智能合约多漏洞检测方法及系统,该方法结合智能合约的抽象语法树和语义信息,利用函数粒度代码属性图对智能合约源代码进行表征;并根据智能合约不同类型漏洞的语法特征定义切片准则,使用程序切片技术对智能合约图表示进行降噪并结合门控图神经网络进行特征提取,基于提取的特征进行漏洞预测。本发明的优势在于:结合多种图结构表征智能合约源代码,充分保留了代码的语法、语义信息和上下文结构;利用程序切片技术去除与漏洞检测无关的噪声代码,提升了检测的准确性;基于门控图神经网络自动学习多种漏洞的特征,提高了漏洞检测的适用范围和检测效率,降低了检测成本。

    漏洞定位方法、系统、计算机设备和存储介质

    公开(公告)号:CN112528290B

    公开(公告)日:2023-07-18

    申请号:CN202011403255.4

    申请日:2020-12-04

    Applicant: 扬州大学

    Abstract: 本发明公开了一种漏洞定位方法、系统、计算机设备和存储介质,方法包括:构建漏洞数据集;构建漏洞的可疑语句空间;构建排序学习模型;利用排序学习模型获取漏洞的可疑语句排序,依据优先级顺序依次遍历可疑语句,查找漏洞所在位置。本发明充分利用引入一个新的漏洞的数据特征及克隆技术,扩大了可疑语句的搜索空间,使其不再限制于基于测试用例下的定位语句方法,增加了定位语句的可能性。同时利用排序学习的技术将可疑语句值进行排序,将有利于更快的输出错误语句的优先值顺序即可疑值顺序,从而更快速的定位到错误语句。本发明充分利用漏洞所提供的信息,提取出所需要的代码和文本进行排序学习的模型训练,很好的克服了人为规定等方式的不足。

    一种面向多源漏洞信息的事件图谱自动构建方法及系统

    公开(公告)号:CN113656805B

    公开(公告)日:2023-06-20

    申请号:CN202110828495.7

    申请日:2021-07-22

    Applicant: 扬州大学

    Abstract: 本发明提出了一种面向多源漏洞信息的事件图谱自动构建方法及系统,从文本和代码信息两个角度将CVE、NVD等网站中的漏洞相关信息进行整合。首先从漏洞数据库中爬取漏洞报告,将漏洞的发生原因视为事件触发词进行识别,并通过其判断漏洞类型。其次通过命名实体识别的方式对描述中的攻击者、后果、位置等信息进行识别,并进行信息补全。再利用文本信息抽取显式的事件关系,并利用文本相似性抽取隐式的事件关系,并进行漏洞相关代码的表征。最终借助可视化工具将所得的漏洞事件信息可视化为事件图谱,从而为开发人员提供更直观准确的漏洞事件及其相关因素,减少开发人员手动分析和理解漏洞数据的人力和时间成本,提高软件维护的有效性和高效性。

    阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置

    公开(公告)号:CN113742733B

    公开(公告)日:2023-05-26

    申请号:CN202110909147.2

    申请日:2021-08-09

    Applicant: 扬州大学

    Abstract: 本发明公开了一种阅读理解漏洞事件触发词抽取和漏洞类型识别方法及装置,所述方法包括:漏洞数据采集;漏洞描述语句表示学习;利用图卷积网络GCN构造漏洞描述文本的句法依存关系,提取漏洞特征;基于BERT微调模型中的问答任务,实现漏洞事件触发词识别及分类。本发明可以更好地利用漏洞描述中的语法和语义信息,充分挖掘漏洞描述中的上下文信息,达到对漏洞事件触发词的识别和分类,可以一定程度上解决漏洞分类不准确的问题,相较于目前流行的事件触发词抽取方法,能够捕获不同事件间的依存关系,并且与已有漏洞分类方法相比,可以输出漏洞事件的触发词,辅助开发人员分析漏洞。

    一种基于Bert模型的方法层次缺陷定位方法

    公开(公告)号:CN111427775B

    公开(公告)日:2023-05-02

    申请号:CN202010169037.2

    申请日:2020-03-12

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于Bert模型的方法层次缺陷定位方法,该方法包括:构建并训练Bert模型;获取与待定位缺陷相关的历史已修复缺陷;基于Bert模型构建缺陷定位模型;训练缺陷定位模型;利用训练后的缺陷定位模型预测待定位缺陷对应的缺陷方法。本发明提出的方法采用历史数据和深度学习技术相结合训练缺陷定位模型,同时利用Bert模型分别训练缺陷报告编码器和源代码编码器,并利用其确定缺陷定位模型中源代码编码器的参数,增强了定位模型中源代码编码器的特征提取能力。此外,通过提炼相关的历史已修复缺陷,缩小了缺陷定位的搜索范围,提高了定位的准确度,很好地达到了在方法级别上定位软件缺陷的目的,进而提升软件缺陷修复的效率。

    一种基于生理参数的驾驶员疲劳检测方法

    公开(公告)号:CN109938719B

    公开(公告)日:2023-02-03

    申请号:CN201910215255.2

    申请日:2019-03-21

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于生理参数的驾驶员疲劳检测方法,包括步骤:首先采用PPG光电容积脉搏波描记法每10ms采集一次待检测驾驶员血液中的透光率数据,对透光率数据作滤波、除噪以及模数转换预处理操作后,对待测驾驶员进行心电波形检测;对心电波形中的R波峰进行检测,得到R‑R间期序列,并将异常的R波从R‑R间期序列中删除,进而得到正确R‑R间期序列;然后对正确R‑R间期序列进行时域分析,计算得到时域指标的R‑R间期均值RR.mean;同时对正确R‑R间期序列进行快速傅里叶变换,进行频域分析后获取频域指标LF/HF;最后基于R‑R间期均值RR.mean和频域指标LF/HF判定待检测驾驶员的疲劳状态;本发明可实现对驾驶员的实时及高精度检测,可有效对驾驶员是否存在疲劳驾驶进行监测和提醒。

    一种基于代码知识图谱的缺陷搜索方法及系统

    公开(公告)号:CN115562673A

    公开(公告)日:2023-01-03

    申请号:CN202211190008.X

    申请日:2022-09-28

    Applicant: 扬州大学

    Abstract: 本发明公开了一种基于代码知识图谱的缺陷搜索方法及系统,从文本和代码角度将Mozilla@Bugzilla,Eclipse@Bugzilla,Github以及Stack overflow网站的缺陷修复前后的代码进行整合,爬取不同的主题,并构建主题集,同事提取帖子中缺陷代码和正确代码,建立以缺陷代码、正确代码、缺陷报告中的标题信息、帖子标题信息和问题描述信息、主题为实体的代码知识图谱,借助可视化工具将代码知识图谱可视化。从多平台的爬取,使得缺陷代码知识图谱的覆盖内容更多,范围更广,同时,通过融合代码文本及代码信息,普及了代码知识,使得开发人员能够直观的对缺陷代码拥有一定了解,开发人员检索时能够快速查询到修复后的代码信息。

Patent Agency Ranking