-
公开(公告)号:CN113378907B
公开(公告)日:2024-01-09
申请号:CN202110626138.2
申请日:2021-06-04
Applicant: 南京大学
IPC: G06F30/27
Abstract: 本发明公开了增强数据预处理过程的自动化软件可追踪性恢复方法,包括:选取待恢复追踪关系的制品,抽取制品相关字段进行数据清洗并开展特征工程,获取样本数据集;利用标签标记方法,将样本数据集划分为标记数据集与缺失追踪数据集;利用四折时间序列验证方法,将标记数据集切分为标记训练集与测试集;利用半监督不平衡学习框架,组合标记训练集与缺失追踪数据集,生成新的训练集;利用多种重采样方式,均衡训练集,训练二分类模型,评估其性能,恢复制品间的追踪关系;从增强数据预处理过程出发,通过多种增强措施应对项目制品多、数据质量差、样本数据不平衡等问题,在F1值、精确率、召回率上均有大幅度提升。(56)对比文件杨丙贤等“.基于软件结构的文档与代码间可追踪性研究”《.计算机科学与探索》.2013,全文.张一帆等“.自然语言数据驱动的智能化软件安全评估方法”《.软件学报》.2018,全文.荣国平.“软件过程与管理方法综述”《.软件学报》.2019,全文.李锐“.基于表示学习的社交网络链接预测方法研究”《.中国硕士学位论文全文数据库》.2021,全文.邱昱“.面向移动广告的欺诈检测算法研究”《.中国硕士学位论文全文数据库》.2021,全文.Xin Xia等“.Towards more accuratemulti-label software behavior learning”.《2014 Software Evolution Week - IEEEConference on Software Maintenance,Reengineering, and Reverse Engineering(CSMR-WCRE)》.2014,全文.Rajasekar Venkatesan等.“A NovelOnline Real-time Classifier for Multi-label Data Streams”《.https://arxiv.org/abs/1608.08905》.2016,全文.Jing Chen等“.Semantics-Aware PrivacyRisk Assessment Using Self-LearningWeight Assignment for Mobile Apps”《.IEEETransactions on Dependable and SecureComputing》.2018,全文.Simin Wang等“.Machine/Deep Learningfor Software Engineering: A SystematicLiterature Review”《.IEEE Transactions onSoftware Engineering》.2023,全文.Tanujit Chakraborty等.“Hellinger Net:A Hybrid Imbalance Learning Model toImprove Software Defect Prediction”《.IEEETransactions on Reliability》.2020,全文.
-
公开(公告)号:CN113378907A
公开(公告)日:2021-09-10
申请号:CN202110626138.2
申请日:2021-06-04
Applicant: 南京大学
IPC: G06K9/62
Abstract: 本发明公开了增强数据预处理过程的自动化软件可追踪性恢复方法,包括:选取待恢复追踪关系的制品,抽取制品相关字段进行数据清洗并开展特征工程,获取样本数据集;利用标签标记方法,将样本数据集划分为标记数据集与缺失追踪数据集;利用四折时间序列验证方法,将标记数据集切分为标记训练集与测试集;利用半监督不平衡学习框架,组合标记训练集与缺失追踪数据集,生成新的训练集;利用多种重采样方式,均衡训练集,训练二分类模型,评估其性能,恢复制品间的追踪关系;从增强数据预处理过程出发,通过多种增强措施应对项目制品多、数据质量差、样本数据不平衡等问题,在F1值、精确率、召回率上均有大幅度提升。
-
公开(公告)号:CN109088755B
公开(公告)日:2021-07-27
申请号:CN201810860621.5
申请日:2018-08-01
Applicant: 南京大学
Abstract: 本发明公开一种边缘计算环境下基于响应时间预测的复杂事件处理部署方法,包括以下步骤:步骤1、多个operator graph响应时间预测;步骤2、根据步骤1的结果,在一个响应时间最长的operator graph,选择从数据源到数据消费者的预测响应时间最高的路径。在此基础上,选择该路径上未被部署的下一个operator;步骤3、在边缘节点资源受限下的部署方法:监控数据源附近的满足资源条件的边缘节点作为候选节点。在这些候选节点中,选择作为operator的部署节点的条件是:operator部署在该节点后,其实际响应时间最小;步骤4、重复步骤1,2、3,直至所有operator都被部署。
-
公开(公告)号:CN106997395B
公开(公告)日:2020-07-03
申请号:CN201710240188.0
申请日:2017-04-13
Applicant: 南京大学
IPC: G06F16/2455 , G06F16/2453
Abstract: 本发明公开一种移动感知复杂事件并行处理方法。包括以下步骤:步骤1,数据划分:对当前operator产生的数据进行数据映射,将这些数据传输给对应的后续operator;分割属于不同查询范围的数据;步骤2,数据合并:属于同一个划分的数据传输至同一个operator,对数据进行排序,并提交给operator处理模块;步骤3,数据处理:步骤3.1,数据处理,对合并后的数据提交至operator处理模块进行处理;若存在后续operator,将处理后产生的结果转入步骤1;步骤3.2,范围处理结束信号发送,表明operator可以开始处理下一查询范围数据。在移动感知复杂事件处理环境下,通过并行处理来增加系统对输入数据量的负载上限和事件处理的吞吐率时,可以使用本发明。
-
公开(公告)号:CN105824756B
公开(公告)日:2019-01-04
申请号:CN201610154205.4
申请日:2016-03-17
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于代码依赖关系的过时需求自动检测方法,该方法包括:步骤一、比较代码新旧版本间的差异,识别其中影响需求的变更代码元素;步骤二、引入代码中与变更代码元素结构上紧密依赖的其它代码元素,构造变更域;步骤三、提取代码元素的描述信息,形成变更域描述文本;步骤四、发现与代码变更相关的近似候选过时需求集合;步骤五、利用基于相似度值的表决算法,生成近似候选过时需求集合的排序。本发明通过对代码依赖关系的分析,补充了代码变更的上下文信息,从而提高了过时需求检测时的精度,并且该方法能够被自动化执行。本发明还包括一种基于代码依赖关系的过时需求自动检测系统。
-
公开(公告)号:CN108459965A
公开(公告)日:2018-08-28
申请号:CN201810184034.9
申请日:2018-03-06
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种结合用户反馈和代码依赖的软件可追踪生成方法,该方法包括:步骤1、获得目标软件中存在的代码依赖;步骤2、计算代码依赖紧密度,设定紧密度阈值生成代码依赖域;步骤3、基于信息检索方法,产生需求到代码的初始候选列表;步骤4、根据用户反馈和代码依赖优化候选列表。本发明通过结合用户反馈和代码依赖信息,弥补了信息检索方法存在的单词失配问题。本发明只需用户判断少量候选线索的相关性。相对于传统信息检索方法,本发明生成的候选列表准确率和召回率均有大幅度提升。
-
-
-
-
-