-
公开(公告)号:CN113283250B
公开(公告)日:2024-06-21
申请号:CN202110581487.7
申请日:2021-05-26
Applicant: 南京大学
IPC: G06F40/58 , G06F40/211
Abstract: 一种基于句法成分分析的机器翻译自动化测试方法,其特征是使用句法成分分析获取句子的选区结构,并构建蜕变关系,无需参考文本即可评估机器翻译模型的性能。本方法的输入是一组未标记的单语言句子,输出为疑似错误报告列表。该方法主要解决当前测试机器翻译的存在的依赖参考文本、准确性较低、内部参数不可理解、测试预言难以构建的问题。本发明提出了一种新的概念,选区不变性。在语言学中,选区反映了句子与其组成部分之一之间的整体关系,它通常用于描述句子的句法结构的特征。根据语言学中的定义,修饰词不能对句子的结构产生强烈的影响,此特征表明给定句子的选区结构通常保留在其添加修饰语之后的句子的选区结构中,即选区不变性。本方法的步骤包括使用句子压缩模型生成文本扩增模板,使用BERT模型生成选区变体,使用选区解析树模型来表达句子结构,并基于选区不变性检测翻译错误。
-
公开(公告)号:CN117194262A
公开(公告)日:2023-12-08
申请号:CN202311206311.9
申请日:2023-09-18
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开一种基于多样性的深度神经网络测试用例选择方法,属于软件测试与测试用例选择领域。该方法包括:针对未标注测试用例的不确定性和故障方向,将输出向量转换为几个间隔,所述间隔的大小和位置反映模型的不确定性和测试用例的故障模式的信息;根据获得的待测试模型的不确定性和测试用例的故障模式的信息定义基于方向性和不确定性的故障模式和测试集故障模式的计算方法;提出相合度度量来度量候选测试集和已选择的测试集之间的模式差异;基于故障模式和相合度度量,提出基于测试多样性的测试数据选择方法ATS,适应地选择测试数据多样的测试用例子集。本发明解决了基于深度学习的软件中的测试数据预言难获取问题。
-
公开(公告)号:CN117009513A
公开(公告)日:2023-11-07
申请号:CN202310520002.2
申请日:2023-05-09
Applicant: 南京大学
IPC: G06F16/35 , G06N3/0455 , G06N3/0499 , G06F16/951 , G06F18/2415 , G06F18/27
Abstract: 本发明公开一种基于bert模型的事件细粒度舆情分析方法,涉及自然语言处理情感分析领域。具体包括以下步骤:数据获取步骤,用python爬虫采用网络爬虫的方式对微博平台上包含特定关键词的微博信息进行采集包含关键词的微博信息,并将数据存储到TIDB数据库中;使用基于损失分布指导的标签噪声判别与平滑方法,缓解标注噪声对模型的误导;构建情感分析模型,通过领域偏离度修正注意力机制,将先验知识与模型有机结合,从而学习生成一个中文微博文本细粒度分类模型WEBERT,实现中文文本情感六分类;最后将预测的结果输入到双重差分模型中。本发明能帮助研究人员进行快捷且有效的情感分析,在有限的时间内构建有效的分析流程。
-
公开(公告)号:CN116594622A
公开(公告)日:2023-08-15
申请号:CN202310347171.0
申请日:2023-04-03
Applicant: 南京大学
IPC: G06F8/41
Abstract: 本发明公开基于类型推导与数据流分析的Python程序编译方法及系统,属于计算机技术领域。该方法包括:对Python字节码进行控制流和数据流分析,并将所述Python字节码转换为基本块;遍历获得的所述基本块,将Python字节码转换为CPY中间代码,并使用内置方法替换Python API调用;使用类型推导算法推导出CPY中间代码中变量的类型信息,并根据类型推导结果选择静态或动态编译模式,将CPY中间代码转换为不同模式的LLVM中间代码;根据编译模式,调用LLVM链接器来链接已编译的模块或CPython库文件,以生成可执行文件。本发明用于静态编译动态类型语言程序,解决了动态类型语言程序运行效率低的问题,同时本发明采用了静态编译模式和动态编译模式,有效提升了程序的兼容性。
-
公开(公告)号:CN102063374A
公开(公告)日:2011-05-18
申请号:CN201110003162.7
申请日:2011-01-07
Applicant: 南京大学
IPC: G06F11/36
Abstract: 一种使用半监督信息进行聚类的回归测试用例选择方法,记录测试用例的执行覆盖信息,生成函数执行剖面,以量化形式表示测试用例;通过对历史测试结果的分析,获得测试用例之间的约束关系并应用半监督聚类算法分析测试用例,了解它们执行情况的异同,理解程序行为及测试用例之间的联系,在回归测试阶段有效降低测试用例数量并保持足够高的错误检测能力。本发明基于数据挖掘技术,通过测试用例所展现出的程序行为的内在联系来理解程序,使得测试用例的选择变得更加容易和自动化,从而可以更有效的使用这些测试用例进行回归测试,提高了测试用例选择的精确度,提高了回归测试的效率。
-
公开(公告)号:CN119759789A
公开(公告)日:2025-04-04
申请号:CN202411958233.2
申请日:2024-12-27
Applicant: 南京大学
IPC: G06F11/3668 , G06F40/205 , G06F30/20
Abstract: 本发明涉及一种基于文本车祸报告的自动驾驶仿真测试场景生成方法.该技术的目的在于运用自然语言处理领域中的生成式语言模型技术、程序合成领域中的代码生成技术以及软件测试领域的模糊测试理论,解决当前自动驾驶测试领域中缺乏多样化、标准化的高质量仿真测试场景的问题,是一种能够基于自然语言生成多样化的OpenSCENARIO格式的场景文件、运用多种变换算子去变异种子场景以高效率地发现自动驾驶系统中存在的缺陷的方法。
-
公开(公告)号:CN118331883B
公开(公告)日:2024-11-19
申请号:CN202410566350.8
申请日:2024-05-09
Applicant: 南京大学
IPC: G06F11/36 , G06N5/04 , G06V10/764 , G06V10/22
Abstract: 本发明公开一种基于实例级分析的目标检测系统优先级测试方法,该方法专为实例级对象检测系统设计,可帮助测试人员识别这些系统中的检测错误和遗漏。对于检测错误,本发明会根据分类和定位能力为每个预测边界框分配一个怀疑度分数。此外,本发明克服了现有优先级排序方法只关注预测结果的缺点,引入了一种新颖的算法,为每个输入中的潜在检测遗漏区域分配怀疑度分数。通过汇总两类模型误差的得分,能够同时识别假阳性和假阴性。对怀疑度值元素进行优先排序,根据它们的值降序排序,对相应的图像进行灰度化处理,并高亮显示错误区域。测试人员的任务是重点查看突出显示的区域。本发明相比同类技术明显节省预算,并能最大限度地发挥测试人员的作用。
-
公开(公告)号:CN118733447A
公开(公告)日:2024-10-01
申请号:CN202410786654.5
申请日:2024-06-18
Applicant: 南京大学
IPC: G06F11/36 , G06F40/186 , G06F40/30
Abstract: 本发明公开一种基于成分组装的文本测试用例生成方法,属于软件测试与程序分析领域。该方法首先将种子句子分解为基本结构和修饰语,然后对修饰语进行变异,创造更多符合当前句法结构的新修饰语,通过将新的修饰语依次插入基本结构,可以在种子句子的基础上生成多个具有不同结构和语义的新句子,新生成的句子之间具有派生关系和不同的变化程度,根据这些特点,测试人员可以很容易地为不同的NLP任务设计合适的蜕变关系来应用蜕变测试。本发明能有效缓解基准集和自然语言处理应用被评估能力的限制,减少测试数据缺失给NLP应用性能评估带来的影响,实现充分利用有限种子数据,产生更多有效且高质量的新测试用例。
-
公开(公告)号:CN118331883A
公开(公告)日:2024-07-12
申请号:CN202410566350.8
申请日:2024-05-09
Applicant: 南京大学
IPC: G06F11/36 , G06N5/04 , G06V10/764 , G06V10/22
Abstract: 本发明公开一种基于实例级分析的目标检测系统优先级测试方法,该方法专为实例级对象检测系统设计,可帮助测试人员识别这些系统中的检测错误和遗漏。对于检测错误,本发明会根据分类和定位能力为每个预测边界框分配一个怀疑度分数。此外,本发明克服了现有优先级排序方法只关注预测结果的缺点,引入了一种新颖的算法,为每个输入中的潜在检测遗漏区域分配怀疑度分数。通过汇总两类模型误差的得分,能够同时识别假阳性和假阴性。对怀疑度值元素进行优先排序,根据它们的值降序排序,对相应的图像进行灰度化处理,并高亮显示错误区域。测试人员的任务是重点查看突出显示的区域。本发明相比同类技术明显节省预算,并能最大限度地发挥测试人员的作用。
-
公开(公告)号:CN118012738A
公开(公告)日:2024-05-10
申请号:CN202311752012.5
申请日:2023-12-18
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于确定性事件注入的分布式系统回归测试方法及系统。所述回归测试方法提供了一套开放可自定义的环境部署方法和测试事件注入逻辑,在此基础上,程序设计人员可以自行搭建通用的分布式测试环境,模拟常见的网络事件、节点事件、时钟事件,自行封装新的事件,组装事件执行顺序和约束关系,从而生成一个稳定可靠,确定可信的分布式系统回归测试流程,完成对分布式系统的通用回归测试设计。本发明目的在于解决目前分布式系统回归测试存在的困难,以及缺乏统一的确定性分布式回归测试框架的问题,帮助程序设计人员在更短的时间内确定对已有代码的修改没有引入新的错误,更好地保障程序的可靠性。
-
-
-
-
-
-
-
-
-