-
公开(公告)号:CN113742731A
公开(公告)日:2021-12-03
申请号:CN202010487163.2
申请日:2020-05-27
Applicant: 南京大学
Abstract: 一种面向代码漏洞智能检测的数据收集方法构建初始的代码漏洞数据集,再利用经过训练的机器学习模型处理未经标注的代码,根据模型标注和人工标注的结果对数据集进行扩充。其中初始数据集的构建是由代码漏洞检测工具的结果结合测试人员的判断得到,机器模型的训练是利用初始数据集,对于未经标注的代码则结合机器学习模型的判定和测试人员的判断结果确定是否发生误报,并据此扩充数据集。
-
公开(公告)号:CN114780373B
公开(公告)日:2025-05-06
申请号:CN202111471921.2
申请日:2021-11-30
Applicant: 南京大学
IPC: G06F11/3668 , G06V30/19 , G06V30/412
Abstract: 一种基于图像文本融合分析的移动应用众包测试报告排序的方法,其特征是通过自动化地提取众包测试报告的图像和文本特征,根据报告间的相似性度量进行众包测试报告排序为人工审查测试报告负担过大的问题提供新的解决方案。提取完成的图像和文本特征将重新组合缺陷类特征和上下文类特征分别计算相似度。缺陷相似度由问题控件图片相似度和缺陷描述相似度组成,用于表示报告中显示的直接与缺陷相关的信息。上下文相似度由复现步骤相似度和上下文控件相似度组成,它表示上下文信息,包括触发缺陷的操作跟踪和缺陷发生时的活动信息。最后将根据测试报告之间的相似度识别重复的报告,并根据报告揭示新的缺陷的能力进行排序。
-
公开(公告)号:CN114780373A
公开(公告)日:2022-07-22
申请号:CN202111471921.2
申请日:2021-11-30
Applicant: 南京大学
IPC: G06F11/36 , G06F40/289 , G06K9/62 , G06V30/412 , G06V10/74
Abstract: 一种基于图像文本融合分析的移动应用众包测试报告排序的方法,其特征是通过自动化地提取众包测试报告的图像和文本特征,根据报告间的相似性度量进行众包测试报告排序为人工审查测试报告负担过大的问题提供新的解决方案。提取完成的图像和文本特征将重新组合缺陷类特征和上下文类特征分别计算相似度。缺陷相似度由问题控件图片相似度和缺陷描述相似度组成,用于表示报告中显示的直接与缺陷相关的信息。上下文相似度由复现步骤相似度和上下文控件相似度组成,它表示上下文信息,包括触发缺陷的操作跟踪和缺陷发生时的活动信息。最后将根据测试报告之间的相似度识别重复的报告,并根据报告揭示新的缺陷的能力进行排序。
-
公开(公告)号:CN113743096A
公开(公告)日:2021-12-03
申请号:CN202010487202.9
申请日:2020-05-27
Applicant: 南京大学
Abstract: 一种基于自然语言处理的众包测试报告相似度检测的方法,采用自然语言处理技术检测众包工人提交的复杂测试报告的相似度,其中功能是对众测报告进行中文分词、去停用词等预处理,将预处理完之后的词组表示的句子利用Word2Vec技术表示为词向量,选取余弦相似度的度量方式计算词向量之间的距离,采用根据先前大量众测报告数据训练的语义模型进行训练,再将各词向量作为K‑Means聚类分析的输入,对各个词向量进行聚类分析,根据设定的相似度阈值将相似的报告归为同一类,可以较为准确的衡量众包测试报告之间的相似度。
-
-
-