一种基于自然语言处理的焦点实体属性预测技术

    公开(公告)号:CN115730598A

    公开(公告)日:2023-03-03

    申请号:CN202211106729.8

    申请日:2022-09-09

    Applicant: 南京大学

    Abstract: 本发明属于自然文本分析预测领域,用于焦点类型的实体属性预测。本发明提供一种基于自然语言处理的焦点实体属性预测技术,该技术不仅能输出当前属性预测模型中常见的客观预测值,还能归纳输出文本数据中的针对实体的不同属性的不同预期值或评价。本发明根据用户提供的实体集合和属性集合构建更大的相关实体集合或迭代集合并爬取大量文本数据用于基础的属性预测和属性发展趋势预测。本发明输出的预期值和评价能够用于指导不同实体的优化、或预测其发展方向,针对当前文本数据利用率低,隐藏信息挖掘量少的问题,提高了焦点实体信息准确获取的能力并为属性预测的下流应用提供更丰富且有价值的数据。

    一种针对递归神经网络驱动的对话系统的自动化测试方法

    公开(公告)号:CN113204488A

    公开(公告)日:2021-08-03

    申请号:CN202110581488.1

    申请日:2021-05-26

    Applicant: 南京大学

    Abstract: 一种针对递归神经网络驱动的对话系统的自动化测试方法。该方法基于语义不变的文本数据变换规则,对原始测试集进行扩增变换,生成具有真实性的测试数据;同时,该方法基于计算被测递归神经网络预测测试用例时的Gini不确定系数,选择容易触发被测模型错误行为的测试用例,以提高对话系统的测试效率。在生成测试数据的基础上,通过将被测模型的实际输出结果与数据的真实标签结果进行比较,记录对话系统对测试用例理解出错的实例;同时,该方法可以将生成数据用于被测RNN模型的重新训练,以提升RNN自然语言理解模型的准确性,提升对话系统的鲁棒性,保障对话系统等智能软件的安全可靠性。

    一种面向Python语言的文档缺陷检测方法

    公开(公告)号:CN112579152A

    公开(公告)日:2021-03-30

    申请号:CN201910951887.5

    申请日:2019-09-30

    Applicant: 南京大学

    Abstract: 一种面向Python语言的文档缺陷检测方法,其特征是基于对python语言的静态分析和自然语言处理技术,对python文档中的代码和注释指令中存在的缺陷进行自动检测。该方法涵盖了python代码及注释中最主要的三类错误,包括:自然语言描述相关的反模式,注释中约束条件实现检测,注释中范例代码错误检测。该发明的输入为python源代码包,分别提取代码示例、代码注释、代码名进行分析,检测并输出其中所存在的缺陷。该发明有以下有益效果:从复杂繁琐的文档中精准定位并找出文档缺陷,可以大大提高开发人员的审查效率,同时减少文档阅读者的阅读障碍及理解错误。自动化检测出文档中所存在的错误,对于软件的开发和维护都有着重要意义。

    基于代码组装的深度学习框架测试方法

    公开(公告)号:CN117033173A

    公开(公告)日:2023-11-10

    申请号:CN202310805601.9

    申请日:2023-07-03

    Applicant: 南京大学

    Abstract: 本发明公开了基于代码组装的深度学习框架测试方法,属于软件测试及深度学习框架测试领域。该方法使用代码组装技术,包括:首先,选定若干经典模型作为种子模型,分析其结构特点,然后将种子模型拆分成框架和可嵌入框架的语句,这之后根据一定的相似度算法对语句中的接口进行变异,并使用重塑形、参数适配和相似度阈值等手段来保证嵌入框架后生成的测试用例有较高的成功率,大幅减少变异导致的形状不匹配等问题,组装生成大量的测试用例后对框架进行测试,并使用过滤器筛选出有效的报错信息,同时使用剪枝来提高效率,最后,通过对错误报告及其对应的用例进行分析,即可发现潜在问题,对深度学习框架实现更全面的测试与评估。

    一种基于语义分析的自动化语音翻译测试方法

    公开(公告)号:CN119808799A

    公开(公告)日:2025-04-11

    申请号:CN202411958082.0

    申请日:2024-12-27

    Applicant: 南京大学

    Abstract: 一种基于语义分析的语音翻译系统自动化测试方法,其特征是使用句法分析获取句子的句法结构,并构建蜕变关系,无需参考文本或额外的标注信息即可评估语音翻译模型的性能.该方法主要解决当前语音翻译测试方法存在的依赖参考文本、测试预言难以构建的问题.本发明提出了一种新的概念,句法结构不变性.在语言学中,依存结构和成分结构常被用来描述一个句子的句法结构.根据语言学中的定义,修饰语则是可选的修饰部分,不能对句子的句法结构产生强烈的影响.本方法的步骤包括使用文本测试用例生成工具和音素对齐工具生成音频扩增模板,使用噪声注入和音频拼接生成测试音频,使用句法结构解析树来表达句子结构,并基于句法结构不变性检测翻译错误。

    基于代码语义一致性的深度学习框架差分测试方法和系统

    公开(公告)号:CN118409966A

    公开(公告)日:2024-07-30

    申请号:CN202410555054.8

    申请日:2024-05-07

    Applicant: 南京大学

    Abstract: 本发明公开一种基于代码语义一致性的深度学习框架差分测试方法,使用自然语言处理领域中的语义分析技术、程序分析领域中的静态代码分析技术以及软件测试领域的模糊测试和蜕变测试理念去自动化地捕获深度学习框架中存在的缺陷,是一种能够生成语义一致的对应于多个深度学习框架的代码、运用多种数据变换算子去生成深度学习框架的输入数据以高效率地发现深度学习框架中存在的缺陷的方法。

    一种面向场景特征的语音识别系统的测试方法

    公开(公告)号:CN117133272A

    公开(公告)日:2023-11-28

    申请号:CN202311214187.0

    申请日:2023-09-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向场景特征的语音识别系统的测试方法,属于软件测试领域。该方法包括如下步骤:针对DNN驱动的语音识别系统定义蜕变关系;采用能够从原始语音数据中生成真实语音数据的语音转换算子实现所述蜕变关系;针对语音转换算子转换时语音数据出现失真,通过计算余弦相似度并设置相似度阈值Tcs来控制转换后语音数据的失真程度;为防止出现语音识别模型生成的语音与原始语音有显著差异,而所述语义保留步骤是有效的,使用基尼不纯度来度量测试用例混淆被测试模型的可能性;使用生成的测试用例进行测试,包括:使用生成的语音去对语音识别系统进行测试,获取识别结果,所述识别结果的评估指标包括词语错误率WER和词语正确率WCR。

    一种基于移动即时通讯软件的软件缺陷智能跟踪管理方法

    公开(公告)号:CN104615533A

    公开(公告)日:2015-05-13

    申请号:CN201510024283.8

    申请日:2015-01-15

    Applicant: 南京大学

    Abstract: 本发明提供一种基于移动即时通讯软件的软件缺陷智能跟踪管理方法,包括下列步骤:1)软件缺陷描述消息的采集;2)软件缺陷报告的自动生成;3)软件缺陷报告特征向量的生成;4)软件缺陷报告严重等级的自动划分;5)软件缺陷报告的自动分派;6)软件缺陷报告的定位和修复。本发明解决了目前存在的软件缺陷跟踪管理方法不能满足敏捷软件开发需要的问题,大幅提升软件缺陷跟踪管理的易用性和运转效率,提高了软件测试工作效率,从而更好地控制产品的质量。

    基于代码语义一致性的深度学习框架差分测试方法和系统

    公开(公告)号:CN118409966B

    公开(公告)日:2025-02-14

    申请号:CN202410555054.8

    申请日:2024-05-07

    Applicant: 南京大学

    Abstract: 本发明公开一种基于代码语义一致性的深度学习框架差分测试方法,使用自然语言处理领域中的语义分析技术、程序分析领域中的静态代码分析技术以及软件测试领域的模糊测试和蜕变测试理念去自动化地捕获深度学习框架中存在的缺陷,是一种能够生成语义一致的对应于多个深度学习框架的代码、运用多种数据变换算子去生成深度学习框架的输入数据以高效率地发现深度学习框架中存在的缺陷的方法。

    基于物理感知对象插入的多传感器融合感知系统测试方法

    公开(公告)号:CN118363860A

    公开(公告)日:2024-07-19

    申请号:CN202410547426.2

    申请日:2024-05-06

    Applicant: 南京大学

    Inventor: 冯洋 高新宇

    Abstract: 本发明公开一种基于物理感知对象插入的多传感器融合感知系统测试方法,给定原始多模态测试数据集,从3D数据库中选择对象物体作为待插入对象;通过执行姿态估计模块来计算待插入对象有效位置;多传感器仿真模块利用物理感知的虚拟模拟器将插入对象生成模态一致的图像和点云对象实例;根据插入对象实例和选定位置,多传感器仿真模块将插入对象与背景数据融合并处理物体遮挡,生成逼真的多模态测试数据;为提升测试效率,提出相合度度量来度量合成多模态测试数据的故障揭示能力。该方法可高效检测融合感知系统中故障,并利用生成的测试用例对系统进行再训练以提高系统的健壮性。解决了多传感器融合感知系统中的测试数据获取难、测试效率低的问题。

Patent Agency Ranking