-
公开(公告)号:CN115002045B
公开(公告)日:2022-12-09
申请号:CN202210845956.6
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所
IPC: H04L47/2483 , G06N3/04
Abstract: 本发明涉及计算机网络技术领域,公开了一种基于孪生网络的暗网站点会话识别方法及系统,该识别方法,基于Meek网桥捕获的暗网会话,构建孪生神经网络模型对暗网站点进行识别。本发明解决了现有技术存在的难以深度表征Meek流量下暗网站点会话的特征、模型泛化性不足、难以保障识别暗网站点会话的准确性等问题。
-
公开(公告)号:CN114168860A
公开(公告)日:2022-03-11
申请号:CN202111366898.0
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/9536 , G06F16/35
Abstract: 本发明提供一种基于网络特征的暗网站点用户关联方法及装置,所述方法包括如下步骤:S10,采用pattern匹配提取暗网中的网络特征;S20,根据提取的网络特征通过聚类实现暗网用户关联。本发明通过网络特征提取以及基于网络特征聚类的用户关联,可精准识别具备关联关系的暗网用户,并且关联方式简单,关联准确率高。从而能够可有效发现暗网中的关联信息,为暗网数据追踪溯源、暗网数据监控、暗网数据治理提供有力的技术支撑。
-
公开(公告)号:CN114090901A
公开(公告)日:2022-02-25
申请号:CN202111367617.3
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/9536 , G06F16/35 , G06K9/62 , G06Q30/06
Abstract: 本发明提供一种基于多模融合特征的暗网相似商品判定方法、存储介质及计算装置,所述方法包括:步骤10,采集暗网商品数据并对商品分类;其中,采集的暗网商品数据包括商品文字和商品图片,并对采集的商品图片生成md5值;步骤20,基于步骤1中采集的暗网商品数据以及商品分类结果,计算商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值;步骤30,基于商品图片的md5值、商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值,对商品相似度进行计算。本发明通过构建一种融合商品图片和商品文本的相似度计算方法,能够解决暗网商品图片模糊,文字信息简单,相似商品的判定存在困难的问题。
-
公开(公告)号:CN114090796A
公开(公告)日:2022-02-25
申请号:CN202111367064.1
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/38 , G06F16/35 , G06F16/36 , G06F40/284
Abstract: 本发明提供一种多平台文本二级标签体系搭建及完善迭代的方法,包括:S10,迭代扩充一级标签下的代表词;S20,基于代表词确定初始二级标签;S30,基于初始二级标签完成二级标签扩充与融合。本发明的有益效果是:1、本发明通过代表词语料获取,词向量模型训练,相似词提取的方式扩充代表词数量,极大地减少了人工收集的过程,并且也较大的降低了人工筛选的难度。2、本发明利用代表词聚类的方式自动化生成各代表词的标签类别,对于人工归纳二级标签提供了便利型。3、本发明使用测试文本进行二级标签的进一步扩充融合的方法除了提高了二级标签的覆盖率,对于新文本二级标签的归类和新建也提供了帮助。
-
公开(公告)号:CN114090772A
公开(公告)日:2022-02-25
申请号:CN202111237872.6
申请日:2021-10-25
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/35 , G06F16/955 , G06K9/62 , G06Q30/06
Abstract: 本发明提供了一种基于文本分类和信息抽取的暗网商品标注方法及系统,构建暗网商品分类体系,对商品进行分类,得到商品的分类标签;提取暗网商品描述文本中的关键信息获取信息标签;融合分类标签与信息标签对商品进行标注。本发明提出的方案结合文本分类和信息抽取技术构建一套暗网商品分类体系,包含封闭的一二级类别和开放的三级类别;可实现暗网商品的多维度标注,在保证覆盖粗粒度和细粒度标签的同时达到较高的准确率;有监督模型训练样本构建过程中只需标注一二级类别,信息抽取模型无需构建训练样本,降低人工标注所需的人力成本。
-
公开(公告)号:CN114124551A
公开(公告)日:2022-03-01
申请号:CN202111430097.6
申请日:2021-11-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明提供一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,包括:获取流量数据的pcap文件;对pcap文件中pcap格式的流量数据进行数据预处理,得到会话数据;对会话数据进行多粒度特征提取,得到多粒度特征库;基于多粒度特征库,利用机器学习算法训练模型以及进行加密流量识别,并输出加密流量识别结果。本发明实现了一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,从而实现对WireGuard协议下的恶意加密流量的检测。并进一步从包级、会话级以及主机级等多个粒度提取流量特征,提高特征的区分性与抗噪性,从而提升模型检测的准确性。
-
公开(公告)号:CN114124551B
公开(公告)日:2023-05-23
申请号:CN202111430097.6
申请日:2021-11-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明提供一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,包括:获取流量数据的pcap文件;对pcap文件中pcap格式的流量数据进行数据预处理,得到会话数据;对会话数据进行多粒度特征提取,得到多粒度特征库;基于多粒度特征库,利用机器学习算法训练模型以及进行加密流量识别,并输出加密流量识别结果。本发明实现了一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,从而实现对WireGuard协议下的恶意加密流量的检测。并进一步从包级、会话级以及主机级等多个粒度提取流量特征,提高特征的区分性与抗噪性,从而提升模型检测的准确性。
-
公开(公告)号:CN113886670A
公开(公告)日:2022-01-04
申请号:CN202111475705.5
申请日:2021-12-06
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/906 , G06F16/903 , G06F16/2458 , G06Q10/04 , G06Q50/26
Abstract: 本发明公开了一种基于标注体系的暗网站点用户画像方法,包括以下步骤:S1、从暗网用户发布商品中抽取用户联系方式;S2、利用商品标注技术对暗网商品进行分类;S3、基于用户发布商品类别,完善用户兴趣点和犯罪类型;S4、根据用户基本信息、联系方式、兴趣点和犯罪类型对用户进行画像。本发明结合暗网数据特性,提供一套通用的暗网交易站点用户画像方案,利用文本分类模型、统计方法等手段对暗网用户的相关信息进行分析,从用户基本信息、联系方式、兴趣点、涉案类型维度对暗网用户进行全方位刻画。
-
公开(公告)号:CN113849759A
公开(公告)日:2021-12-28
申请号:CN202111430236.5
申请日:2021-11-29
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/958 , G06K9/46 , G06K9/62
Abstract: 本发明公开了一种基于图像特征的暗网站点用户关联方法,包括以下步骤:S1、对暗网数据进行采集并对图像特征进行计算,基于图像特征对商品id进行关联;S2、根据图像特征与商品id的关联关系,得到基于图像特征的暗网用户关联关系。本发明构建一种基于相似图像的暗网用户关联策略,可实现暗网用户关联,且关联准确率较高,可有效利用暗网中的图像模态信息。通过暗网数据采集、图像特征计算、贴文关联、用户关联,可有效发现暗网中的关联信息,为暗网数据追踪溯源、暗网数据监控、暗网数据治理提供有力的技术支撑。
-
-
-
-
-
-
-
-