一种基于自注意力机制的自融合代码理解方法

    公开(公告)号:CN115586900A

    公开(公告)日:2023-01-10

    申请号:CN202110764933.8

    申请日:2021-07-06

    Applicant: 南京大学

    Abstract: 本发明提出了一种基于自注意力机制的路径融合的代码理解方法,用于将Java源代码文件理解为低维稠密语义向量,并基于该向量表示代码中的语义与语法信息。同时,本方法基于代码方法名称预测与代码文本相似度评估两个方面,对代码理解方法进行训练以及评估。该发明的主要创新在于(1)基于自注意力机制,提出了一种全新的AST路径解析方法;(2)提出了一种基于循环神经网络的源代码理解方法,获得更为全面准确的语义信息;(3)提出了更为合理的源代码翻译模型与相似度评估模型,并超越了现有方法。

    一种面向Python语言的文档缺陷检测方法

    公开(公告)号:CN112579152A

    公开(公告)日:2021-03-30

    申请号:CN201910951887.5

    申请日:2019-09-30

    Applicant: 南京大学

    Abstract: 一种面向Python语言的文档缺陷检测方法,其特征是基于对python语言的静态分析和自然语言处理技术,对python文档中的代码和注释指令中存在的缺陷进行自动检测。该方法涵盖了python代码及注释中最主要的三类错误,包括:自然语言描述相关的反模式,注释中约束条件实现检测,注释中范例代码错误检测。该发明的输入为python源代码包,分别提取代码示例、代码注释、代码名进行分析,检测并输出其中所存在的缺陷。该发明有以下有益效果:从复杂繁琐的文档中精准定位并找出文档缺陷,可以大大提高开发人员的审查效率,同时减少文档阅读者的阅读障碍及理解错误。自动化检测出文档中所存在的错误,对于软件的开发和维护都有着重要意义。

    一种利用QR码储存私密数据的方法

    公开(公告)号:CN102622630A

    公开(公告)日:2012-08-01

    申请号:CN201210045028.8

    申请日:2012-02-24

    Applicant: 南京大学

    Inventor: 郑滔 詹珣 刘嘉

    Abstract: 本发明提出一种利用QR码储存私密数据的方法,包括下列步骤:a)按照非私密数据和私密数据的总长度确定QR码的版本号;b)按照QR码编码方式将非私密数据存入QR码中,填入终止符0000;c)存储私密数据;d)将私密数据的长度数据存入QR码功能区的定位图形中。本方法利用QR码中未使用的数据存储区域来存储私密数据,既完全兼容普通解码器,又写入了私密数据,同时能对功能区中的私密数据的长度进行纠错。

    一种定制QR码的生成方法
    14.
    发明公开

    公开(公告)号:CN102622629A

    公开(公告)日:2012-08-01

    申请号:CN201210044800.4

    申请日:2012-02-24

    Applicant: 南京大学

    Inventor: 郑滔 詹珣 刘嘉

    Abstract: 定制QR码的生成方法,首先,指定QR码中需要存储的数据,其次定制QR码的外观的指标,指定寻像图形外圈和内圈的颜色或填充图片、指定前景色或前景填充图片、背景色或背景填充图片、独立点颜色或填充图片;最后,根据定制的内容生成QR码的矩阵,并以指定的外观显示在界面上。QR码的生成工具很多,但是我们需要一种可以定制个性化QR码的生成工具。本发明实现一种可以随意定制QR码的生成工具。

    一种通过渲染方式生成QR码的方法

    公开(公告)号:CN102622628A

    公开(公告)日:2012-08-01

    申请号:CN201210044120.2

    申请日:2012-02-24

    Applicant: 南京大学

    Inventor: 郑滔 詹珣 刘嘉

    Abstract: 通过渲染方式生成QR码的方法,包括以下三种独立的方法或二种以上的组合:以小块图片替换每一个黑白块,小块图片有多个,根据需要进行选择;对QR码符号不同的部分使用不同大小的图片进行填充,同时将原本的方角矩形改为圆角矩形,将独立存在的黑白块使用圆形图片进行填充;使用立体图形呈现QR码。普通QR码都以黑白的外观呈现,本发明在不影响识别的前提下以一种更加美观的方式呈现QR码。本发明生成的QR码上都可以覆盖上小图标,使得生成的QR码具有使用者的独特特征。本发明使得可以以更加丰富的形式来呈现原本比较单调的QR码。

    一种可视化软件测试设计平台

    公开(公告)号:CN102236602A

    公开(公告)日:2011-11-09

    申请号:CN201110203876.2

    申请日:2011-07-21

    Applicant: 南京大学

    Abstract: 一种可视化软件测试设计平台,包括动态链接库(DLL)注册模块、测试流程编辑模块、测试流程解析模块、测试流程执行模块以及测试管理模块;其中,测试管理模块对所有模块进行调度并管理;动态链接库注册模块负责将底层接口定义为测试编辑模块中的原子测试单元;测试流程编辑模块提供可视化的测试解决方案定义工具,测试解决方案包括功能测试图、测试流程图及各图之间的关联关系,通过DLL注册模块将外部DLL的函数定义为流程图中的原子测试单元;测试流程执行模块载入测试流程解析模块生成的中间代码,建立测试执行的虚拟机环境,根据已定义的流程的逻辑自动完成测试过程。

    一种面向垂直电子商务网站的首页推荐方法

    公开(公告)号:CN102073717A

    公开(公告)日:2011-05-25

    申请号:CN201110002136.2

    申请日:2011-01-07

    Applicant: 南京大学

    Abstract: 面向垂直电子商务网站的首页推荐方法,通过脚本(如JavaScript)采集用户的“访问带入信息”和“下单产品信息”;根据历史数据计算“访问带入信息”各维度和“下单产品信息”各维度的相关度作为推荐基础;当一个新用户访问网站首页时,根据该用户的“访问带入信息”和通过历史数据得到的相关度矩阵计算得到该用户和所有产品的相关度,推荐相关度最高的N件产品。本发明能够适用于垂直电子商务网站的新用户既没有历史行为信息数据(历史评分,浏览,购买等行为),大部分情况也没有人口统计信息数据等殊场景的需要。垂直电子商务网站旗下的商品都是同一类型的商品,垂直电子商务的用户中新用户的比例很高,本发明方法是有益的。

    一种基于语义分析的自动化语音翻译测试方法

    公开(公告)号:CN119808799A

    公开(公告)日:2025-04-11

    申请号:CN202411958082.0

    申请日:2024-12-27

    Applicant: 南京大学

    Abstract: 一种基于语义分析的语音翻译系统自动化测试方法,其特征是使用句法分析获取句子的句法结构,并构建蜕变关系,无需参考文本或额外的标注信息即可评估语音翻译模型的性能.该方法主要解决当前语音翻译测试方法存在的依赖参考文本、测试预言难以构建的问题.本发明提出了一种新的概念,句法结构不变性.在语言学中,依存结构和成分结构常被用来描述一个句子的句法结构.根据语言学中的定义,修饰语则是可选的修饰部分,不能对句子的句法结构产生强烈的影响.本方法的步骤包括使用文本测试用例生成工具和音素对齐工具生成音频扩增模板,使用噪声注入和音频拼接生成测试音频,使用句法结构解析树来表达句子结构,并基于句法结构不变性检测翻译错误。

    基于代码语义一致性的深度学习框架差分测试方法和系统

    公开(公告)号:CN118409966A

    公开(公告)日:2024-07-30

    申请号:CN202410555054.8

    申请日:2024-05-07

    Applicant: 南京大学

    Abstract: 本发明公开一种基于代码语义一致性的深度学习框架差分测试方法,使用自然语言处理领域中的语义分析技术、程序分析领域中的静态代码分析技术以及软件测试领域的模糊测试和蜕变测试理念去自动化地捕获深度学习框架中存在的缺陷,是一种能够生成语义一致的对应于多个深度学习框架的代码、运用多种数据变换算子去生成深度学习框架的输入数据以高效率地发现深度学习框架中存在的缺陷的方法。

    一种面向场景特征的语音识别系统的测试方法

    公开(公告)号:CN117133272A

    公开(公告)日:2023-11-28

    申请号:CN202311214187.0

    申请日:2023-09-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向场景特征的语音识别系统的测试方法,属于软件测试领域。该方法包括如下步骤:针对DNN驱动的语音识别系统定义蜕变关系;采用能够从原始语音数据中生成真实语音数据的语音转换算子实现所述蜕变关系;针对语音转换算子转换时语音数据出现失真,通过计算余弦相似度并设置相似度阈值Tcs来控制转换后语音数据的失真程度;为防止出现语音识别模型生成的语音与原始语音有显著差异,而所述语义保留步骤是有效的,使用基尼不纯度来度量测试用例混淆被测试模型的可能性;使用生成的测试用例进行测试,包括:使用生成的语音去对语音识别系统进行测试,获取识别结果,所述识别结果的评估指标包括词语错误率WER和词语正确率WCR。

Patent Agency Ranking