一种基于5G移动网络流量分析的应用识别方法和系统

    公开(公告)号:CN113382039A

    公开(公告)日:2021-09-10

    申请号:CN202110494589.5

    申请日:2021-05-07

    Abstract: 本发明公开了一种基于5G移动网络流量分析的应用识别方法和系统。本方法为:1)数据采集模块采集5G移动网络流量并将其发送给DPI识别模块;2)DPI识别模块对数据链路层和网络层进行拆包,获取五元组以及时间戳信息,然后根据五元组以及时间戳信息对数据包进行分类合并成流;然后根据每一流中数据包的明文特征判断该流对应的应用层协议;3)DFI识别模块从网络流量数据包中提取流量的多粒度级别特征,包括流特征、数据包特征、主机行为特征、TCP头部特征、IP头部特征;然后对得到的多粒度级别特征进行过滤;4)DFI识别模块根据过滤后的流的特征利用基于结构数据依赖的DBSCAN方法识别该流所属应用。

    一种并行的数据差分方法
    73.
    发明授权

    公开(公告)号:CN107016053B

    公开(公告)日:2020-05-22

    申请号:CN201710121255.7

    申请日:2017-03-02

    Abstract: 本发明提供一种并行的数据差分方法,步骤包括:(1)文件预处理:将源文件和目标文件初始化,生成源文件的后缀数组,创建补丁文件并初始化;(2)目标文件切分:根据线程数目切分目标文件,为切分后的每一部分目标文件增加一个线程进行独立处理;(3)线程处理过程:在每一线程中,初始化切分后的目标文件,创建patch文件,通过上述后缀数组比较源文件与目标文件生成差分数据,将该差分数据写入该patch文件;(4)主进程合并处理:将上述各线程的已写入差分数据的patch文件一起写入上述补丁文件。本方法采用多线程并行技术,来提高生成补丁的速度。

    一种基于文本分类的中文表格列标签恢复方法和系统

    公开(公告)号:CN109710725A

    公开(公告)日:2019-05-03

    申请号:CN201811524302.3

    申请日:2018-12-13

    Abstract: 本发明涉及一种基于文本分类的中文表格列标签恢复方法和系统。该方法的步骤包括:1)从表格中的每一行中提取实体,在网络百科知识平台中搜索提取的实体,获取实体对应的信息详情页面;2)对实体的每一个属性,在实体的信息详情页面中抽取包含属性值的句子,组成属性值的相关文本;3)将属性值的相关文本输入文本分类器中,获取属性值所属的类别,即为属性值所在单元格的类别;4)对于表格的属性列,根据属性列中各单元格所属的类别,使用多数投票的规则确定该属性列的列标签。本发明能够有效的对网络表格进行列标签恢复,恢复列标签后的表格可用于中文知识图谱的构建和扩展,也可用于数据抽取和表格搜索等应用。

    一种基于卷积神经网络的用户属性推断方法和装置

    公开(公告)号:CN108492200A

    公开(公告)日:2018-09-04

    申请号:CN201810124041.X

    申请日:2018-02-07

    Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。

    一种增量式的自动机更新方法与系统

    公开(公告)号:CN107038026A

    公开(公告)日:2017-08-11

    申请号:CN201710112499.9

    申请日:2017-02-28

    CPC classification number: G06F8/658

    Abstract: 本发明涉及一种增量式的自动机更新方法与系统。该方法包括:1)配置处理机进行初始化操作,根据配置文件生成初始自动机,并将初始自动机发送到各扫描机;2)配置处理机根据新配置文件生成更新后的自动机,并对更新后的自动机和更新前的自动机进行数据差分,生成自动机增量;3)配置处理机将自动机增量发到各扫描机,各扫描机根据自动机增量和更新前的自动机生成更新后的自动机。本发明一方面可以尽量减少因为初始化自动机而漏掉的需要过滤的数据,同时还能应用一些初始化时间较长的新的效果比较好的串匹配算法;另一方面可以避免因为发送完整自动机而导致的网络拥塞问题。

    一种并行的数据差分方法
    78.
    发明公开

    公开(公告)号:CN107016053A

    公开(公告)日:2017-08-04

    申请号:CN201710121255.7

    申请日:2017-03-02

    Abstract: 本发明提供一种并行的数据差分方法,步骤包括:(1)文件预处理:将源文件和目标文件初始化,生成源文件的后缀数组,创建补丁文件并初始化;(2)目标文件切分:根据线程数目切分目标文件,为切分后的每一部分目标文件增加一个线程进行独立处理;(3)线程处理过程:在每一线程中,初始化切分后的目标文件,创建patch文件,通过上述后缀数组比较源文件与目标文件生成差分数据,将该差分数据写入该patch文件;(4)主进程合并处理:将上述各线程的已写入差分数据的patch文件一起写入上述补丁文件。本方法采用多线程并行技术,来提高生成补丁的速度。

    一种高效的静态哈希表实现方法及系统

    公开(公告)号:CN106326475A

    公开(公告)日:2017-01-11

    申请号:CN201610793354.5

    申请日:2016-08-31

    Abstract: 本发明涉及一种高效的静态哈希表实现方法及系统。该方法包括以下步骤:1)设定哈希桶大小hash_bit,生成多个数据对,将key[i]和value[i]对应于关键字和值;2)根据key[i]值,利用rank操作构建哈希表,并计算C表和D表;3)根据C表和D表计算rank(h),并根据rank(h)的值存储相应的key[i]和value[i];4)根据所要查询的值key判断哈希表中是否存在该元素,若存在则在对应存储位置查询并返回value值,否则访问失败;5)根据步骤4)所得的结果返回结果信息。本发明利用Rank-select算法实现新型静态哈希表的构建与访问,可用于内容过滤、信息安全等领域。

    一种对稀疏矩阵进行压缩和查询的方法及系统

    公开(公告)号:CN104809161A

    公开(公告)日:2015-07-29

    申请号:CN201510152316.7

    申请日:2015-04-01

    Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2-tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2-tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。

Patent Agency Ranking