一种司法领域数据的规范方法

    公开(公告)号:CN110609828A

    公开(公告)日:2019-12-24

    申请号:CN201810561376.8

    申请日:2018-05-29

    Applicant: 南京大学

    Abstract: 本发明旨在提出司法数据标准制的一般方法,目的在于为司法信息化系统间整合提供数据基础、提高数据质量和促进数据的共享,从而完善进一步完善司法信息化建设。此工作方法分为四个主要环节:数据需求的定义、数据清单的产生、数据标准的制定、数据标准的审定。这一方法为构建司法数据仓库打下基础,能够提高数据仓库的源系统数据的一致性和可用性,为司法数据标准规划提供了一套可以借鉴的思路。

    一种结合群体智能与机器智能增强移动应用测试的方法

    公开(公告)号:CN110688321A

    公开(公告)日:2020-01-14

    申请号:CN201910952056.X

    申请日:2019-09-29

    Applicant: 南京大学

    Abstract: 本发明提出一种结合群体智能与机器智能增强移动应用测试的方法,用于增强机器智能的代码覆盖率,以获得更多发现缺陷的机会。该发明的主要创新在于两方面,一方面是将群体智能产出的代码进行了格式化的整理,从而找出群体智能在应用进行的测试中,不同页面之间进行转移的最短路径与相同页面内,和仅在少数代码中出现的特异路径,并保存为自动化工具的配置文件;另一方面将这些整理后的路径通过配置文件接入到机器智能中,使得机器智能可以解决由于部分页面之间的转移需要进行逻辑性操作(组合操作)而难以甚至无法实现的问题。

    一种基于噪音数据的机器学习模型鲁棒性评估方法

    公开(公告)号:CN110717602B

    公开(公告)日:2023-08-29

    申请号:CN201910952057.4

    申请日:2019-09-29

    Applicant: 南京大学

    Abstract: 本发明提供的是一种基于噪音数据的机器学习模型鲁棒性评估方法,包括原始数据集处理、噪音数据获取、模型训练、模型预测、准确率下降比计算和模型鲁棒性评估。原始数据集处理包括收集百分百标签正确的原始数据集,并采用10次10‑折交叉验证划分原始训练集和原始测试集。噪音数据获取包括在原始训练集的基础上,采用分层抽样方法抽取t′=|D|·α个数据,并将其标签替换为错误标签,其中α为噪音数据率。模型训练包括基于常见分类算法,并分别输入原始训练集和混有噪音数据的训练集分别构建原始模型和新模型。模型预测包括基于原始测试集,对这原始模型和新模型分别进行准确度评估。准确率下降比计算包括计算新模型较原始模型而言准确率下降的比率。模型鲁棒性评估包括横纵向比较准确率下降的比率的大小,衡量模型鲁棒性强弱,实现了判断模型健壮性的标准。

    一种基于程序切片的深度神经网络类型推导方法

    公开(公告)号:CN114580641A

    公开(公告)日:2022-06-03

    申请号:CN202210052087.1

    申请日:2022-01-17

    Applicant: 南京大学

    Abstract: 本发明涉及一种基于程序切片的深度神经网络类型推导方法,首先获取大量包含类型标注信息的动态语言程序项目,提取项目中的类型信息,构建类型信息数据集;然后用编码技术将提取的类型信息数据集嵌入成向量形式;最后用嵌入向量训练深度神经网络模型并使用训练好的模型预测程序变量类型或函数签名。本发明目的在于解决目前存在的动态语言程序类型推导效率低、准确率低的问题,提高动态语言程序在软件工程的生产实践中的可读性、可理解性和可维护性,最终实现提高软件质量保障的目标。

    一种基于句法成分分析的自动化机器翻译测试方法

    公开(公告)号:CN113283250A

    公开(公告)日:2021-08-20

    申请号:CN202110581487.7

    申请日:2021-05-26

    Applicant: 南京大学

    Abstract: 一种基于句法成分分析的机器翻译自动化测试方法,其特征是使用句法成分分析获取句子的选区结构,并构建蜕变关系,无需参考文本即可评估机器翻译模型的性能。主要解决当前测试机器翻译的存在的依赖参考文本。准确性较低、内部参数不可理解、和测试预言难以构建的问题。选区反映了句子与其组成部分之间的整体关系,它通常用于描述句子的句法结构的特征。由于修饰词不能对句子的结构产生强烈的影响,给定句子的选区结构通常保留在其添加修饰语之后的句子的选区结构中,即选区不变性。本方法的步骤包括使用句子压缩模型生成文本扩增模板,使用BERT模型生成选区变体,使用选区解析树模型来表达句子结构,并基于选区不变性检测翻译错误。

    一种功能粒度上基于语义信息的源代码相似度评估方法

    公开(公告)号:CN110737469A

    公开(公告)日:2020-01-31

    申请号:CN201910951997.1

    申请日:2019-09-29

    Applicant: 南京大学

    Abstract: 一种功能粒度上基于语义信息的源代码相似度评估方法,其特征是在功能粒度上使用标识符和控制流图对源码分别进行表示,其中功能是由函数和函数间的调用关系组成的介于源代码文件和函数之间的代码表示,计算功能对应的标识符和控制流图的嵌入向量,将控制流图中节点对应的代码片段用相应的标识符表示替换,再与控制流图的嵌入向量组合得到功能的嵌入向量,接着计算功能的嵌入向量之间的距离,得到源代码之间的相似度,可以较为准确的衡量Type-4克隆。

    一种规则约束下的文本信息质量度量方法

    公开(公告)号:CN110543628A

    公开(公告)日:2019-12-06

    申请号:CN201810561187.0

    申请日:2018-05-29

    Applicant: 南京大学

    Abstract: 本发明提出了一种规则约束下的文本信息质量度量方法,用于帮助对各领域下有规则约束的文本进行数据质量的度量,给出九大数据质量指标,对文本数据质量进行量化。例如司法文书数据等。该发明的主要创新在于(1)利用文本书写规则构建数据质量理论基础;(2)对文本数据质量采用信息质量进行反映;(3)结合六元客观信息论对数据质量指标进行定义,并采用粗糙集对指标进行数学建模。

    一种基于步骤提示的安卓众包测试反馈方法

    公开(公告)号:CN109840191A

    公开(公告)日:2019-06-04

    申请号:CN201711200460.9

    申请日:2017-11-24

    Applicant: 南京大学

    Abstract: 一种基于步骤提示的安卓众包测试反馈方法,其特征是通过众包测试平台Kikbug的驱动程序对测试过程的记录,建立用户测试行为数据库;在测试过程当中,收集当前测试人员的测试步骤信息,和数据库中已记录的、已触发异常的操作信息对比,解决众包测试报告不够专业的问题,以引导测试人员完成更高效的众包测试。(1)建立关于异常的测试行为数据库,通过任务提供者完成所有待测任务,初始化数据库;(2)对比当前测试人员和数据库中的操作序列,引导测试人员触发异常;(3)存储测试过程中出现的新异常;(4)当某异常复现的次数超过阀值,将之定义为已确认的异常,不再引导测试人员验证该异常;(5)将异常反馈给任务提供者。

    一种基于句法成分分析的自动化机器翻译测试方法

    公开(公告)号:CN113283250B

    公开(公告)日:2024-06-21

    申请号:CN202110581487.7

    申请日:2021-05-26

    Applicant: 南京大学

    Abstract: 一种基于句法成分分析的机器翻译自动化测试方法,其特征是使用句法成分分析获取句子的选区结构,并构建蜕变关系,无需参考文本即可评估机器翻译模型的性能。本方法的输入是一组未标记的单语言句子,输出为疑似错误报告列表。该方法主要解决当前测试机器翻译的存在的依赖参考文本、准确性较低、内部参数不可理解、测试预言难以构建的问题。本发明提出了一种新的概念,选区不变性。在语言学中,选区反映了句子与其组成部分之一之间的整体关系,它通常用于描述句子的句法结构的特征。根据语言学中的定义,修饰词不能对句子的结构产生强烈的影响,此特征表明给定句子的选区结构通常保留在其添加修饰语之后的句子的选区结构中,即选区不变性。本方法的步骤包括使用句子压缩模型生成文本扩增模板,使用BERT模型生成选区变体,使用选区解析树模型来表达句子结构,并基于选区不变性检测翻译错误。

Patent Agency Ranking