-
公开(公告)号:CN104317773B
公开(公告)日:2017-05-24
申请号:CN201410589530.4
申请日:2014-10-28
Applicant: 南京大学
IPC: G06F17/10
Abstract: 本发明提出了一种递归最大执行频度与最大执行深度的静态估计方法,该方法通过静态扫描程序源代码以定位递归作用域并收集递归中函数调用与返回的执行条件,然后引入可满足性模求解器来求解这些收集到的符号条件约束,并最终直接获得估计结果。由于避免了反复执行程序,相比于传统的动态估计方法,本发明的方法具有更为高效、准确等优点。所分析的结果可以帮助程序设计、开发、维护人员用于性能优化、能耗估计、实时性分析等计算机应用技术领域。
-
公开(公告)号:CN105512285A
公开(公告)日:2016-04-20
申请号:CN201510892012.4
申请日:2015-12-07
Applicant: 南京大学
IPC: G06F17/30
CPC classification number: G06F17/30864
Abstract: 本发明是一种基于机器学习的自适应网络爬虫方法,由于目前的网络爬虫程序的编写需要软件开发人员通过查询繁琐的页面代码并研究规则,没有自适应的程序自动引导爬虫进行工作。同时,在电子商务领域也并没有这种触及。因此要解决的技术问题是通过机器学习技术对大量数据进行挖掘,从而定位到某一未知网页上与该内容相关的信息。使用机器学习与数据挖掘方法来解决这一问题,主要的技术步骤为:获取数据、特征提取、异构数据归一化、训练数据构建、自适应训练、学习方法验证以及自适应模式生成,用于对所爬取网站的页面代码提取位置特征并进行自适应训练,对电子商务领域的自适应网络爬虫的研究起到了一定的作用。
-
公开(公告)号:CN105512285B
公开(公告)日:2018-11-06
申请号:CN201510892012.4
申请日:2015-12-07
Applicant: 南京大学
IPC: G06F17/30
Abstract: 本发明是一种基于机器学习的自适应网络爬虫方法,由于目前的网络爬虫程序的编写需要软件开发人员通过查询繁琐的页面代码并研究规则,没有自适应的程序自动引导爬虫进行工作。同时,在电子商务领域也并没有这种触及。因此要解决的技术问题是通过机器学习技术对大量数据进行挖掘,从而定位到某一未知网页上与该内容相关的信息。使用机器学习与数据挖掘方法来解决这一问题,主要的技术步骤为:获取数据、特征提取、异构数据归一化、训练数据构建、自适应训练、学习方法验证以及自适应模式生成,用于对所爬取网站的页面代码提取位置特征并进行自适应训练,对电子商务领域的自适应网络爬虫的研究起到了一定的作用。
-
公开(公告)号:CN104317773A
公开(公告)日:2015-01-28
申请号:CN201410589530.4
申请日:2014-10-28
Applicant: 南京大学
IPC: G06F17/10
Abstract: 本发明提出了一种递归最大执行频度与最大执行深度的静态估计方法,该方法通过静态扫描程序源代码以定位递归作用域并收集递归中函数调用与返回的执行条件,然后引入可满足性模求解器来求解这些收集到的符号条件约束,并最终直接获得估计结果。由于避免了反复执行程序,相比于传统的动态估计方法,本发明的方法具有更为高效、准确等优点。所分析的结果可以帮助程序设计、开发、维护人员用于性能优化、能耗估计、实时性分析等计算机应用技术领域。
-
-
-