基于指纹多重哈希布隆过滤器的网络取证内容溯源方法和系统

    公开(公告)号:CN104794170B

    公开(公告)日:2018-05-01

    申请号:CN201510147426.4

    申请日:2015-03-30

    Abstract: 本发明涉及一种基于指纹多重哈希布隆过滤器的网络取证内容溯源方法。该方法对捕获的原始网络流量数据包进行重组并构建应用层的会话;在每一个时间间隔内,将会话内容分块存储到增强版指纹多重哈希布隆过滤器中,并保存会话索引表,每一个分块不仅存储到基本布隆过滤器中,还串联会话索引存储到带会话索引的布隆过滤器中;收到查询请求后,使用相同的方法对所查询的摘录进行分块,然后在可能的时间间隔内的所有存档单元中检索,首先将得到的分块在基本布隆过滤器中查询,若能够查询到这些分块,则将得到的分块串联候选的会话索引,并在带会话索引的布隆过滤器中查询,得到传输该摘录的应用层信息。本发明能够提高网络取证内容溯源能力和准确性。

    一种基于暗网网站综合特征的网站分类方法

    公开(公告)号:CN107341183A

    公开(公告)日:2017-11-10

    申请号:CN201710397901.2

    申请日:2017-05-31

    CPC classification number: G06F17/30864 G06F17/30705

    Abstract: 本发明公开了一种基于暗网网站综合特征的网站分类方法。本方法为:1)爬取目标暗网网站,得到一带标注的暗网网站训练集合;2)提取该集合中每一网站信息进行分词,构建该网站的词的空间向量,并计算每一词的权重;将词与对应权重进行相乘后的空间向量作为网站的文本特征;3)提取该暗网网站训练集合中每一网站的标签,构建该网站的标签的空间向量,并计算每个标签的权重;将标签与对应权重相乘后的空间向量作为网站的结构特征;4)将每一网站的文本特征与结构特征结合得到该网站的综合特征;5)对各网站的综合特征进行训练,得到一分类模型;然后利用该分类模型对待分类网站进行预测,得到该待分类网站的类别。本发明提高了网站分类效率。

    一种基于主机群特征检测速变攻击域名的方法

    公开(公告)号:CN103152222B

    公开(公告)日:2015-11-18

    申请号:CN201310063228.0

    申请日:2013-02-28

    Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。

    一种文档图像的版式识别方法

    公开(公告)号:CN104966051A

    公开(公告)日:2015-10-07

    申请号:CN201510297257.2

    申请日:2015-06-03

    CPC classification number: G06K9/00469

    Abstract: 本发明公开了一种文档图像的版式识别方法,首先设计了一个版式入库功能,库中会保存版式内容,以及由版式内容相对字高、对齐方式生成的版式序列号,如果一张未知图片经过版式分析,得到的版式序列号与库中的某个版式序列号一样,那么将通过库中的提示信息去提取该未知图片的版式信息。本发明通过高效以及准确的版面分析方法来识别文档图片,尤其适用于中文公文文档图像的版式识别。

    一种窃密木马的TCP心跳行为的检测方法

    公开(公告)号:CN103036743B

    公开(公告)日:2015-10-07

    申请号:CN201210555371.7

    申请日:2012-12-19

    Abstract: 本发明涉及一种窃密木马的TCP心跳行为的检测方法,包括:步骤1,抓取网络数据包,还原成TCP数据流;步骤2,检测是否有TCP保活心跳行为;步骤3,检测是否有TCP连接内心跳行为;步骤4,检测是否有TCP连接级心跳行为:步骤5,对检测出的窃密木马心跳行为进行误判检测。本发明基于网络数据包大小、方向和时间等特征,能计算出心跳的周期及其波动的范围,方法简单,检测结果准确全面,能运用在实时检测窃密木马的系统中,具有较好的检测效果。

    一种确定文本视觉相似度的方法

    公开(公告)号:CN104375982A

    公开(公告)日:2015-02-25

    申请号:CN201410564469.8

    申请日:2014-10-21

    Abstract: 本发明涉及一种确定文本视觉相似度的方法,实现步骤如下:(1)计算两个字符串直接的视觉距离;(2)计算两个字符串直接相似度;(3)将以前发邮件记录中的邮件记录最大值与当前电子邮件的最大值作为分类器的特征,来检测特定字符串即电子邮件地址的相似度;(4)将利用随机森林分类器对误发送邮件进行分类训练和检测,以用于检测误发邮件。本发明达到了比传统的检测技术更高的准确率和召回率。

    一种通信网络模拟数据生成方法

    公开(公告)号:CN103763151A

    公开(公告)日:2014-04-30

    申请号:CN201410005380.8

    申请日:2014-01-06

    Abstract: 本发明涉及一种通信网络模拟数据生成方法,包括获取一个通讯网络预定量的真实数据,并按预定规则划分为一系列网络快照,记为训练集G;依据活跃度等级对训练集G进行训练,得到通信网络的各个分布参数,其中活跃度等级为节点作为发信者在训练集的各快照中出现的频度;根据通信网络的分布参数随机生成一系列模拟快照G'n,构成所需的通信网络模拟数据;本发明通过引入活跃度这一隐含属性,提出一种线性的通信网络生成算法,利用已有的通信网络数据来快速生成大量模拟通信网络数据,同时能保证生成的模拟网络既能体现通信网络的宏观性质又可保留个体的通信行为特征。

    一种基于对等网络实现的隐蔽匿名通信方法

    公开(公告)号:CN103475649A

    公开(公告)日:2013-12-25

    申请号:CN201310386340.8

    申请日:2013-08-30

    Abstract: 本发明涉及一种基于对等网络的隐蔽匿名通信方法,包括隐蔽握手和数据交换两个阶段,其中隐蔽握手阶段包括通信发起端在大规模P2P对等网络中秘密的找到另一通信端,并秘密地实现相互认证,以及协商数据通道接洽地点;数据交换阶段包括通信双方通过协商好的数据通道接洽地点实现数据交换,而非通信双方直接交互,其中,进行数据交互时,通信发起端通过协商的数据通道接洽地点衍生若干子数据通道接洽地点,并将待发送的文件分割成若干个分片文件,将各分片文件映射到各子数据通道接洽地点,另一通信端到相应的子数据通道接洽地点获取所需的分片文件,即可拼接成原文件;本方法可提供匿名文件分享、有效保护用户隐私,实现秘密通信。

    一种基于主机群特征检测速变攻击域名的方法

    公开(公告)号:CN103152222A

    公开(公告)日:2013-06-12

    申请号:CN201310063228.0

    申请日:2013-02-28

    Abstract: 本发明涉及一种基于主机群特征检测速变攻击域名的方法,主要包括步骤:1)网络数据包的抓取和DNS报文特征提取;2)速变攻击域名检测;3)误判检测。其中,速变攻击域名检测包括域名对应主机群的IP分散程序计算、服务可用性评估和网络波动检测,为本发明的核心;误判检测排除速变攻击域名检测过程中正常的大型网络域名和在线率探测中本地网络不佳时的检测结果。本发明分析局域网内DNS报文的集合,基于域名对应的主机群IP分散程度和在线率等特征,避免了对单个DNS报文进行分析的准确率问题,且在计算IP距离时考虑域名对应主机群的规模,从而避免大型良性速变网络被误判。

    一种针对URL的分词方法及装置

    公开(公告)号:CN108228710B

    公开(公告)日:2021-09-28

    申请号:CN201711237280.8

    申请日:2017-11-30

    Abstract: 本发明涉及一种针对URL的分词方法及装置。该方法包括:1)对URL地址按照其内在的层次结构进行分割,得到若干层次部分;2)对所述若干层次部分依次进行符号分割与正则表达式过滤;3)对步骤2)处理后得到字符串进行分割,得到URL分词序列。其中步骤1)将URL地址分割为五个层次部分:协议类型、自由域名、二级域名、顶级域名和路径;步骤3)利用双向最大匹配算法和概率模型对字符串进行分割。本发明充分利用了URL本身的层次结构,能够高效地对URL进行分割,并最大化地保留了URL地址中的有用信息,得到的URL分词序列可用于网页分类、钓鱼URL检测等任务中的特征分析,能够有效提高任务准确率。

Patent Agency Ranking