-
公开(公告)号:CN114579130A
公开(公告)日:2022-06-03
申请号:CN202011374137.5
申请日:2020-11-30
Applicant: 南京邮电大学
IPC: G06F8/41
Abstract: 本发明为一种基于程序分析的Node.JS代码片段环境依赖性的自动推断方法:首先,根据libraries.io数据集中的SourceRank构建已知npm包的知识库;其次,使用静态分析,动态分析和关联规则挖掘的组合来发现有关包依赖性的信息,并根据其互相之间的关系建模为相互依赖图,使用图形数据库存储;然后,对于给出的新的Node.JS代码片段,解析目标代码并提取所有导入资源的列表,将其映射回一组可以安装的软件包,再利用一种用于遵循安装顺序的直接依赖和传递依赖性的推理算法,查找到的依赖项进行正确排序,得到最后的返回结果。
-
公开(公告)号:CN111460142A
公开(公告)日:2020-07-28
申请号:CN202010150086.1
申请日:2020-03-06
Applicant: 南京邮电大学
IPC: G06F16/35 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于自注意力卷积神经网络的短文本分类方法和系统,该方法包括:首先对短文本数据集进行预处理,得到词的初始特征向量,组成的短文本矩阵输入到Word2vec模型中,从而得到词向量;接着将输入短文本矩阵至Self-attention层,对每个标记Token的上下文信息进行编码,经过卷积层、池化层后抽取短文本的高级语义特征向量,并输入至Softmax分类器进行文本分类识别;所述系统包括文本预处理模块、Word2vec预训练模块、Self-attention模块、卷积池化模块、分类器模块。本发明在短文本特征学习模型中融合了自注意力机制,可以有效地突出上下文关键词的作用,使得模型的性能得到了很大的提高,且能够降低计算的误差,提高文本数据分类的准确率。
-
公开(公告)号:CN111008038A
公开(公告)日:2020-04-14
申请号:CN201911321442.5
申请日:2019-12-19
Applicant: 南京邮电大学
Abstract: 本发明为一种基于逻辑回归模型的pull request被合并概率的计算方法:首先,确定PRs复杂性的指标并提取项目中PRs的相关信息;其次,使用提取的数据作为数据集训练逻辑回归模型;最后,使用训练好的逻辑回归模型预测新的PR合并的概率,为贡献者提供一个在评审之前进行改进的机会,以减轻评审者的负担。
-
公开(公告)号:CN110990055A
公开(公告)日:2020-04-10
申请号:CN201911321383.1
申请日:2019-12-19
Applicant: 南京邮电大学
Abstract: 本发明为一种基于程序分析的Pull Request功能分类方法:首先,对当前版本项目和Pull Request中修改文件的提取。其次,对于待分析的程序,使用程序分析框架Soot,选择传递方式生成调用图Callgragh,遍历Callgragh直到调用的是第三方库提供的方法,将遍历到的节点和边保存到数据库中。然后,读取并分析数据库中保存的节点和边的关系,以Pull Request中的文件作为图的节点,构建图的邻接表结构。最后,基于图的深度优先遍历算法遍历邻接表的所有结点,以遍历的结果作为文件的功能分类,针对无调用关系的文件,以文件后缀名进行处理。
-
公开(公告)号:CN104166668B
公开(公告)日:2018-02-23
申请号:CN201410254094.5
申请日:2014-06-09
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明提供一种基于FOLFM模型的新闻推荐系统及方法,在基于内容推荐方法的基础上,利用隐类模型和内容特征对新闻内容模型进行抽象表达,为每个用户构建其个性化的隐类偏好模型。通过对用户的实时行为记录进行实时训练得到用户对于某个隐类新闻的偏好,计算决定新闻是否推荐给用户,并经过一系列的处理过程得到最终的新闻推荐列表,本发明深入挖掘用户兴趣,提高推荐准确率及用户满意度,避免新闻的冷启动问题,在尽可能提高推荐效果的情况下保证性能。经实验表明,本发明既保证了高精度和高速度要求,又实现了用户视觉上的实时推荐。
-
公开(公告)号:CN103268332B
公开(公告)日:2016-03-02
申请号:CN201310166690.3
申请日:2013-05-06
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明给出了一种基于社区结构的可信的服务选择方法,对用户需求的分析得到满足功能需求的大量网络服务,通过对这些服务调用日志的分析,构造出网络服务合作网络,与此同时,根据用户会对使用过的服务进行评价,得到用户网络。在网络服务合作网络和用户网络基础上,运用社区结构挖掘算法,找出核心可信服务和核心可信用户,建立服务声誉评价模型,找出可信服务。同时淘汰恶意服务和恶意用户。最终目的是开发一种选择可信服务的方法。
-
公开(公告)号:CN104572476A
公开(公告)日:2015-04-29
申请号:CN201510051325.7
申请日:2015-01-30
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 本发明给出了一种基于程序切片的软件安全测试方法,该方法对程序切片技术进行了探讨,并提出了一种基于程序切片的不可达路径检测方案。本方法以网页中提取的JavaScript脚本语言代码为输入,将其转换成为LLVM中间表示,然后分别对其进行静态程序切片和动态程序切片。由于静态程序切片对程序的输入不做任何假设,所做的分析完全以程序的静态信息为依据,所以会把不可达路径包含到切片结果中。然而对于动态程序切片,它关注的是在某个特定输入下执行的路径行为,而不会关注变量所有可能的输入导致的路径行为,因此动态切片的结果往往不会含有不可达路径。通过将静态程序切片与动态程序切片相结合,可以检测程序中的不可达路径,从而提高软件的测试效率。
-
公开(公告)号:CN102637143B
公开(公告)日:2014-12-10
申请号:CN201210057888.3
申请日:2012-03-07
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 基于改进的支持向量机的软件缺陷优先级预测方法主要采用一种改进的支持向量机模型为缺陷优先级的预测建模,对缺陷报告的处理优先级进行判断和预测,步骤1)选取状态为已解决的,已关闭的,已确定的错误报告做为训练数据;步骤2)提取出我们需要的特征;步骤3)对所有样本赋以一个抽样权重在此样本上用支持向量机训练一个分类器对样本分类,步骤4)用得到的错误率去更新分布权值向量:对错误分类的样本分配更大的权值,正确分类的样本赋予更小的权值。步骤5)就这样依次迭代,最后我们得到的强分类器就是多个弱分类器的加权和。本发明用机器学习的发法训练出分类器,从而使缺陷优先级的确定自动化,减少人员和成本的消耗。
-
公开(公告)号:CN104008051A
公开(公告)日:2014-08-27
申请号:CN201410210134.6
申请日:2014-05-16
Applicant: 南京邮电大学
IPC: G06F11/36
Abstract: 本发明提供一种频谱信息去冗优化的软件缺陷定位方法,通过运行测试用例,收集程序运行结果信息即频谱信息;对所得频谱信息进行去冗优化处理,利用频谱信息计算可疑度;根据可疑度值的大小对语句进行降序排列,根据已排序的语句序列逐个进行排错,直至找到引发程序异常的语句。本发明在基于频谱的错误定位方法中,在利用覆盖信息表进行可疑度计算之前,对频谱信息进行去冗余处理,利用有效的频谱信息进行可疑度计算,提高根据可疑度进行缺陷定位的可靠性,进而提高软件缺陷定位的效率。
-
公开(公告)号:CN102629261B
公开(公告)日:2014-07-16
申请号:CN201210051171.8
申请日:2012-03-01
Applicant: 南京邮电大学
IPC: G06F17/30
Abstract: 本发明是一种由钓鱼网页查找目标网页的方法,首先从网页文本和网页图片中提取关键词,组成该钓鱼网页的词汇签名,然后在多个搜索引擎上用词汇签名进行检索,综合这些搜索引擎的结果,找出最相近的前K个网页,将这K个网页和钓鱼网页以图片形式保存,提取图像感知哈希序列,最后分别计算这K个网页图片与钓鱼网页图片之间的海明距离,根据距离的大小可以选出该钓鱼网页模仿的一个或者多个合法网页,即目标网页。
-
-
-
-
-
-
-
-
-