-
公开(公告)号:CN113946823A
公开(公告)日:2022-01-18
申请号:CN202111218213.8
申请日:2021-10-20
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明提供一种基于URL基线偏离度分析的SQL注入检测方法及装置,所述方法包括:构建基线的步骤;样本再划分的步骤;有监督学习的步骤。本发明的有益效果是:(1)通过构造基线和样本再划分,不仅能提升白样本的纯度,使对正常业务的http流量数据的画像更精确,同时还能从业务数据中发现黑样本,缩小训练样本中的正负样本比例,使分类器更加高效快速训练与预测。同时,黑样本能不断累积,具有较强的灵活性。(2)本发明从多个维度进行特征构造,刻画较为全面,同时黑样本的不断累积,使得可以发现新的SQL注入方式,具有强大的适应性。
-
公开(公告)号:CN113886670A
公开(公告)日:2022-01-04
申请号:CN202111475705.5
申请日:2021-12-06
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/906 , G06F16/903 , G06F16/2458 , G06Q10/04 , G06Q50/26
Abstract: 本发明公开了一种基于标注体系的暗网站点用户画像方法,包括以下步骤:S1、从暗网用户发布商品中抽取用户联系方式;S2、利用商品标注技术对暗网商品进行分类;S3、基于用户发布商品类别,完善用户兴趣点和犯罪类型;S4、根据用户基本信息、联系方式、兴趣点和犯罪类型对用户进行画像。本发明结合暗网数据特性,提供一套通用的暗网交易站点用户画像方案,利用文本分类模型、统计方法等手段对暗网用户的相关信息进行分析,从用户基本信息、联系方式、兴趣点、涉案类型维度对暗网用户进行全方位刻画。
-
公开(公告)号:CN118394955B
公开(公告)日:2024-09-27
申请号:CN202410840949.6
申请日:2024-06-27
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/36 , G06F16/33 , G06F40/295 , G06F16/901 , G06N5/02 , G06N20/00
Abstract: 本发明公开了一种结合AI Agent的暗网领域知识图谱构建与检索的方法及系统,该方法包括根据暗网领域的专家知识,构建本体,定义实体类型、实体属性、关系类型、关系属性;从对暗网贴文中抽取实体和关系;通过AI Agent对提取的实体和关系进行数据增强;响应用户的查询并生成对应的检索内容。本发明实现了对暗网数据的高效抽取、实体信息智能扩展和暗网内容精准检索。
-
公开(公告)号:CN117892727B
公开(公告)日:2024-05-17
申请号:CN202410288617.1
申请日:2024-03-14
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F40/289 , G06F40/216 , G06F9/54 , G06F16/903
Abstract: 本发明公开了一种实时文本数据流去重系统及方法,涉及数据去重领域,其中去重系统包括:数据输入端,所述数据输入端由用于接收与发送文本数据流的消息队列组成;数据处理端,所述数据处理端由流处理引擎组成,能够按不同语种对文本数据进行预处理,并基于改进Ksentence进行文本标识计算,最后形成输出数据流;数据输出端,所述数据输出端能够将数据处理端的输出数据流存储至对应的数据库中;并以此提出了一种去重方法;本发明,侧重于对海量性、实时性的文本进行去重,适用于在线实时场景。
-
公开(公告)号:CN117951246A
公开(公告)日:2024-04-30
申请号:CN202410351116.3
申请日:2024-03-26
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/31 , G06F16/36 , G06F16/335 , G06F40/30 , G06N3/0455 , G06F16/23 , G06F16/22 , G06F16/28
Abstract: 本发明公开了一种网络技术新词发现及应用领域预测方法和系统,涉及自然语言处理领域,用于提高网络技术新词发现和领域预测的准确度。本发明包括三个部分,第一部分是利用人工收集和Glove词向量模型获取相似词的方式,初步确定种子新词及其应用领域;第二部分是采集外部知识库中最新更新的科学文本数据入库;第三部分是融合使用多种NLP模型确定网络技术新词并且对相应应用领域进行预测。本发明深度挖掘了网络技术新词的自身特征,充分考虑其在语句中所表达的含义,在保证正确率的条件下,提高新词召回率;利用最大公共子串对新词进行应用领域合并,进一步提高了应用领域预测准确率。
-
公开(公告)号:CN114124467B
公开(公告)日:2023-05-05
申请号:CN202111271019.6
申请日:2021-10-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明公开了一种开放网络模式下FreeNet匿名流量检测方法及系统,其中检测方法包括:数据采集:使用网络抓包工具采集流量数据,获取待识别的流量文件,并存为pcap格式的流量文件;数据预处理:过滤广播流量和ICMP协议流量,提取出会话的五元组信息与有效载荷数据,存为json格式的会话数据;特征提取:基于所述会话数据,提取会话中的特征并形成特征数据集,所述特征包括最大包长度、最小包长度、传输协议、端口个数和报文熵值;FreeNet流量检测:基于所述特征数据集,筛选出可能的FreeNet流量,输出其五元组信息。本发明基于规则策略匹配的方法对FreeNet流量进行检测,计算复杂度低,检测速度快。
-
公开(公告)号:CN115001987A
公开(公告)日:2022-09-02
申请号:CN202210845586.6
申请日:2022-07-19
Applicant: 中国电子科技集团公司第三十研究所
IPC: H04L41/14 , H04L9/08 , H04L9/32 , H04L61/4511
Abstract: 本发明涉及计算机网络技术领域,公开了一种Tor网络的域名规模评估方法及系统,该评估方法,利用描述符中的盲密钥与Tor V3的域名绑定关系对全网隐藏服务进行域名规模评估。本发明解决了现有技术存在的无法实现V3版本域名规模估计的问题。
-
公开(公告)号:CN114124551A
公开(公告)日:2022-03-01
申请号:CN202111430097.6
申请日:2021-11-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明提供一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,包括:获取流量数据的pcap文件;对pcap文件中pcap格式的流量数据进行数据预处理,得到会话数据;对会话数据进行多粒度特征提取,得到多粒度特征库;基于多粒度特征库,利用机器学习算法训练模型以及进行加密流量识别,并输出加密流量识别结果。本发明实现了一种WireGuard协议下基于多粒度特征提取的恶意加密流量识别的方法,从而实现对WireGuard协议下的恶意加密流量的检测。并进一步从包级、会话级以及主机级等多个粒度提取流量特征,提高特征的区分性与抗噪性,从而提升模型检测的准确性。
-
公开(公告)号:CN114124468A
公开(公告)日:2022-03-01
申请号:CN202111271756.6
申请日:2021-10-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明公开了一种基于多协议联合分析的I2P通信流量检测方法及装置,其中检测方法包括:流量原始数据预处理:对PCAP格式的文件进行预处理,包括过滤其他流量,所述其他流量包括ICMP、ARP和DHCP流量;数据处理及深度学习算法识别:利用卷积神经网络CNN对TCP协议传输的加密流量进行训练;统计类特征提取与机器学习算法识别:提取同一会话的上下文流量中UDP流量与TCP流量的相关统计特征,并利用梯度提升树GBDT进行训练;模型融合:将深度学习与机器学习的输出进行融合,并输出最后的预测结果。本发明结合TCP协议与UDP协议会话,提取相关特征,融合机器学习与机器学习,可有效提高I2P流量检测的准确性。
-
公开(公告)号:CN117951246B
公开(公告)日:2024-05-28
申请号:CN202410351116.3
申请日:2024-03-26
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/31 , G06F16/36 , G06F16/335 , G06F40/30 , G06N3/0455 , G06F16/23 , G06F16/22 , G06F16/28
Abstract: 本发明公开了一种网络技术新词发现及应用领域预测方法和系统,涉及自然语言处理领域,用于提高网络技术新词发现和领域预测的准确度。本发明包括三个部分,第一部分是利用人工收集和Glove词向量模型获取相似词的方式,初步确定种子新词及其应用领域;第二部分是采集外部知识库中最新更新的科学文本数据入库;第三部分是融合使用多种NLP模型确定网络技术新词并且对相应应用领域进行预测。本发明深度挖掘了网络技术新词的自身特征,充分考虑其在语句中所表达的含义,在保证正确率的条件下,提高新词召回率;利用最大公共子串对新词进行应用领域合并,进一步提高了应用领域预测准确率。
-
-
-
-
-
-
-
-
-