-
公开(公告)号:CN106484879A
公开(公告)日:2017-03-08
申请号:CN201610899802.X
申请日:2016-10-14
Applicant: 哈尔滨工程大学
IPC: G06F17/30
CPC classification number: G06F16/285 , G06F16/2228
Abstract: 本发明提供的是一种基于MapReduce的Map端数据的聚合方法。包括测试阶段和聚合阶段。测试阶段,通过测试阶段来验证所使用Map端的Map函数中的算法是否适合进行内聚合。内聚合方法是在内存中Map函数的计算过程中进行的,计算完一部分后就进行聚合;外聚合方法是在Map函数将所有数据计算完存入磁盘后,再调入内存进行聚合。聚合阶段,若测试通过,使用内聚合方法对Map端计算后的数据进行聚合;若测试未通过,使用外聚合方法对Map端计算的后的数据进行聚合。本发明根据数据的特点,保证计算结果正确的前提下,选择相应的聚合方式,在减少I/O的访问次数的同时,减少传输 的通信量。
-
公开(公告)号:CN106384050A
公开(公告)日:2017-02-08
申请号:CN201610821507.2
申请日:2016-09-13
Applicant: 哈尔滨工程大学
IPC: G06F21/56
CPC classification number: G06F21/566
Abstract: 本发明提供的是一种基于最大频繁子图挖掘的动态污点分析方法。包括动行为依赖图构建、最大频繁子图挖掘和行为依赖图匹配三个部分。采用邻接矩阵存储行为依赖图,其中顶点间的数据关联边用1表示,控制关联边用2表示,无相应依赖边用0表示。最大频繁子图挖掘算法即SPIN-MBDGM算法的主要思想是首先使用FFSM算法从行为依赖图集中得到频繁子树,然后通过添加候选数据关联边和控制关联边的扩展算法生成最大频繁子图。该方法的主要优点是从同一恶意代码家族所有的行为依赖图中挖掘最大公共部分,在不丢失特征信息的情况下减少特征库中行为依赖图的数量,从而提高识别速度。
-
公开(公告)号:CN106484879B
公开(公告)日:2019-08-06
申请号:CN201610899802.X
申请日:2016-10-14
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种基于MapReduce的Map端数据的聚合方法。包括测试阶段和聚合阶段。测试阶段,通过测试阶段来验证所使用Map端的Map函数中的算法是否适合进行内聚合。内聚合方法是在内存中Map函数的计算过程中进行的,计算完一部分后就进行聚合;外聚合方法是在Map函数将所有数据计算完存入磁盘后,再调入内存进行聚合。聚合阶段,若测试通过,使用内聚合方法对Map端计算后的数据进行聚合;若测试未通过,使用外聚合方法对Map端计算的后的数据进行聚合。本发明根据数据的特点,保证计算结果正确的前提下,选择相应的聚合方式,在减少I/O的访问次数的同时,减少传输 的通信量。
-
公开(公告)号:CN106384050B
公开(公告)日:2019-01-15
申请号:CN201610821507.2
申请日:2016-09-13
Applicant: 哈尔滨工程大学
IPC: G06F21/56
Abstract: 本发明提供的是一种基于最大频繁子图挖掘的动态污点分析方法。包括动行为依赖图构建、最大频繁子图挖掘和行为依赖图匹配三个部分。采用邻接矩阵存储行为依赖图,其中顶点间的数据关联边用1表示,控制关联边用2表示,无相应依赖边用0表示。最大频繁子图挖掘算法即SPIN‑MBDGM算法的主要思想是首先使用FFSM算法从行为依赖图集中得到频繁子树,然后通过添加候选数据关联边和控制关联边的扩展算法生成最大频繁子图。该方法的主要优点是从同一恶意代码家族所有的行为依赖图中挖掘最大公共部分,在不丢失特征信息的情况下减少特征库中行为依赖图的数量,从而提高识别速度。
-
-
-