-
公开(公告)号:CN106485223B
公开(公告)日:2019-07-12
申请号:CN201610891454.1
申请日:2016-10-12
Applicant: 南京大学
Abstract: 本发明公开了一种砂岩显微薄片中岩石颗粒的自动识别方法,其步骤是:1)对输入的砂岩显微薄片进行高斯平滑滤波预处理,提取像素颜色和纹理特征,组成像素相似度度量的特征向量;2)利用图遍历算法和相似性度量方法寻找每个像素的邻近像素群;3)计算邻近像素群的统计特征作为像素的特征向量;4)基于岩石颗粒样本数据集训练逻辑回归分类器;5)预测每个像素属于石英、长石、岩屑的概率,确定噪声点;6)对噪声点进行处理,确定岩石颗粒划分和类别。本方法运用图像处理技术和机器学习方法,自动识别砂岩显微薄片中的岩石颗粒,能够解决岩石颗粒区域边界的定位和岩石颗粒内杂质的识别,具有较高的准确性,降低岩石颗粒识别的时间和成本;在矿物鉴别、油气勘探中具有应用价值。
-
公开(公告)号:CN105354600B
公开(公告)日:2018-10-23
申请号:CN201510628405.4
申请日:2015-09-28
Applicant: 南京大学
IPC: G06K9/66
Abstract: 本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。
-
公开(公告)号:CN105095091B
公开(公告)日:2018-01-09
申请号:CN201510610763.2
申请日:2015-09-23
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于倒排索引技术的软件缺陷代码文件定位方法,属于计算机软件测试和维护技术领域,该方法的步骤1)汇总软件系统中的代码文件;步骤2)对代码文件记录分词;步骤3)读入缺陷报告;步骤4)在倒排索引表中检索每一个关键词;步骤5)根据关键词评分对文件索引项排序,定位包含缺陷的代码文件。本发明通过关键词查询和统计推荐高风险的代码文件,能够快速准确地定位包含缺陷的软件代码文件,适用于大型软件系统的测试和维护工作;同时本发明计算简单,适用于不同类型的编程语言,及不同规模的计算机软件,具有扩展性和适应性且便于使用并行算法,能快速有效地分析和处理大量的缺陷报告信息,进而有效的提高软件缺陷定位的效能。
-
公开(公告)号:CN105354600A
公开(公告)日:2016-02-24
申请号:CN201510628405.4
申请日:2015-09-28
Applicant: 南京大学
IPC: G06K9/66
CPC classification number: G06K9/66
Abstract: 本发明公开了一种砂岩显微薄片的自动分类方法,其步骤是:1)对砂岩的显微薄片图像进行预处理,分割矿物颗粒;2)以颗粒为单位分别提取纹理和形状特征,选择代表颗粒,构成薄片图像的特征向量;3)对目标地域的砂岩薄片,基于欧氏距离采用近邻法选择相似的砂岩薄片样本,构建训练集合;4)精化训练集数据,包括类间平衡和特征降维;5)训练随机森林分类器,预测砂岩薄片的种类。本方法运用图像处理技术和机器学习方法,自动鉴别来自不同地域的砂岩薄片种类,能够解决由于地域不同导致的砂岩薄片结构差异较大而难于互相借鉴的问题。
-
公开(公告)号:CN103309811B
公开(公告)日:2015-09-16
申请号:CN201310264686.0
申请日:2013-06-27
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于测试执行记录快速定位软件代码缺陷的方法,其步骤是:1)以测试用例为单位,整理测试执行记录;2)以代码行为单位,建立正交信息表,分别统计代码覆盖数据和执行结果数据;3)根据正交信息表,计算代码行的缺陷怀疑率;按照怀疑率排序,辅助定位代码缺陷。本发明方法从软件失效和代码覆盖两个角度,运用正交分析方法,发掘软件代码缺陷和软件执行结果之间的逻辑依赖关系,准确定位包含缺陷的代码行;同时计算简单,适用于不同类型的编程语言,以及不同规模的计算机软件,具有扩展性和适应性;能够快速处理大量的测试执行记录信息;提高软件缺陷定位的性能和效率。
-
公开(公告)号:CN101902470B
公开(公告)日:2013-08-21
申请号:CN201010226471.6
申请日:2010-07-14
Applicant: 南京大学
IPC: H04L29/06
Abstract: 本发明公开了一种基于表单特征的Web安全漏洞动态检测方法,其步骤是:1)对Web应用的待测页面、其表单及表单域的自动化特征进行提取,收集并保存数据;2)以表单为测试单位,为各个表单域赋予一组测试候选值,并初步生成全组合测试用例集;然后为每个测试用例计算一个权值,最后利用最大权值选择法生成测试用例集;3)测试用例集执行,4)针对各个测试用例的执行结果进行潜在安全漏洞分析,汇总生成测试报告。本发明方法通过对Web表单进行特征分析,运用领域知识有针对性的为表单域赋予安全漏洞检测值,并与Web服务器进行交互获取服务器响应,根据响应结果自动检测Web应用中潜在的安全漏洞。
-
公开(公告)号:CN103236013A
公开(公告)日:2013-08-07
申请号:CN201310167850.6
申请日:2013-05-08
Applicant: 南京大学
IPC: G06Q40/06
Abstract: 本发明公开了一种基于关键股票集识别的股票市场大盘数据分析方法,其步骤是:1)收集数据,计算股票成交量之间的关联关系,构建股票关联网络;2)在股票关联网络中,以迭代的方式应用搜索算法识别关键股票集合;3)根据关键股票的价格走势,以成交量为权重计算大盘走势期望。本发明方法充分挖掘股票成交量之间的关联关系,能够根据股票市场的交易情况,准确判定处于活跃状态且具有影响力的股票,提高股票市场大盘走势预测的准确性。计算简单,具有时效性、灵活性和扩展性,可调整对历史数据的处理需求,适用于股票市场数据量大且股票交易变动频繁的情况。
-
公开(公告)号:CN102214246B
公开(公告)日:2013-01-23
申请号:CN201110200423.4
申请日:2011-07-18
Applicant: 南京大学
Abstract: 本发明公开了一种互联网上汉语电子文档阅读分级的方法,首先确定汉字、词组、以及语句结构指标在不同级别文档的频率分布;筛选用来对文档阅读分级的汉字和词组,避开常用词和冷僻词的干扰;再针对待分级的目标文档,分析文档的字词组成,将文档解析成 二元组向量;计算文档的语句结构指标,包括平均段落长度、平均句子长度、最长句和最短句的长度差异等;最后采用朴素贝叶斯方法,基于汉语文档的字词组成信息和语句结构信息确定文档的阅读级别。通过解析文档的汉字和词组构成,结合文档的语句结构,根据各个字词和结构指标在不同阅读级别文档中的频率分布,运用朴素贝叶斯方法,有效确定了汉语电子文档的阅读级别。
-
公开(公告)号:CN102750647A
公开(公告)日:2012-10-24
申请号:CN201210219288.2
申请日:2012-06-29
Applicant: 南京大学
IPC: G06Q30/02
Abstract: 本发明公开了一种基于交易网络的商家推荐方法,其步骤为:(1)整理交易数据并建立交易网络;(2)根据用户交易历史对用户聚类;(3)对交易网络进行社团划分;(4)应用随机行走方法实现商家推荐。本发明可广泛应用于各类电子商务网站中的商家(卖家)推荐,为广大买家推荐合适的卖家;充分利用买家和卖家的历史交易数据,发掘买家和卖家的偏好特征,分析买家和卖家交易的相似性,合理应用随机行走方法,有效提高商家推荐的准确性和针对性。所采用的计算方法简单高效,切合电子商务网站海量交易数据、同时买家和卖家交易信息稀疏的特性,有较好的扩展性和适用性;有效填补目前电子商务网站商家推荐方面的空白。
-
公开(公告)号:CN102736979A
公开(公告)日:2012-10-17
申请号:CN201210219282.5
申请日:2012-06-29
Applicant: 南京大学
IPC: G06F11/36
Abstract: 本发明公开了一种基于符号执行的带反馈测试用例生成方法,其步骤为:(1)执行已有的测试用例并收集测试用例覆盖信息;(2)根据被测程序的控制流图确定符号执行的覆盖目标;(3)对被测试程序插桩,植入符号执行的控制代码;(4)从已有测试用例集中选择合适的种子测试用例;(5)针对覆盖目标应用符号执行方法生成新的测试用例,新生成的测试用例补充入测试用例集;(6)重复上述步骤,直至达到给定的测试用例生成目标。本发明可广泛应用于软件开发过程中的自动化测试,自动化生成测试用例,避免单纯符号执行的约束条件爆炸问题,提高效率;同时能够结合其他生成方法,缓解符号执行方法不能处理复杂数据结构的问题。
-
-
-
-
-
-
-
-
-