-
公开(公告)号:CN118394955A
公开(公告)日:2024-07-26
申请号:CN202410840949.6
申请日:2024-06-27
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/36 , G06F16/33 , G06F40/295 , G06F16/901 , G06N5/02 , G06N20/00
Abstract: 本发明公开了一种结合AI Agent的暗网领域知识图谱构建与检索的方法及系统,该方法包括根据暗网领域的专家知识,构建本体,定义实体类型、实体属性、关系类型、关系属性;从对暗网贴文中抽取实体和关系;通过AI Agent对提取的实体和关系进行数据增强;响应用户的查询并生成对应的检索内容。本发明实现了对暗网数据的高效抽取、实体信息智能扩展和暗网内容精准检索。
-
公开(公告)号:CN117874755B
公开(公告)日:2024-05-10
申请号:CN202410281993.8
申请日:2024-03-13
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F21/55 , G06N5/022 , G06F16/36 , G06F40/117 , G06F40/166 , G06F40/279 , G06F16/901
Abstract: 本发明公开了一种识别暗网威胁用户的系统及方法,涉及威胁用户识别领域;其构建了暗网知识图谱,补全用户人物属性与关联属性;使用语言模型,对用户关联的文本内容进行处理与标签标记,补全用户关联的标签特征;协同知识图谱与语言模型,将暗网用户的属性特征、暗网用户的三度关联关系特征、关联实体的扩展属性特征嵌入到语言模型中,实现对暗网威胁用户的准确识别;最后,使用可视化界面对暗网威胁用户进行预警与推送,并展现该用户的三度关系,为决策者提供判断依据;本发明,实现了对暗网威胁用户的准确识别。
-
公开(公告)号:CN117874755A
公开(公告)日:2024-04-12
申请号:CN202410281993.8
申请日:2024-03-13
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F21/55 , G06N5/022 , G06F16/36 , G06F40/117 , G06F40/166 , G06F40/279 , G06F16/901
Abstract: 本发明公开了一种识别暗网威胁用户的系统及方法,涉及威胁用户识别领域;其构建了暗网知识图谱,补全用户人物属性与关联属性;使用语言模型,对用户关联的文本内容进行处理与标签标记,补全用户关联的标签特征;协同知识图谱与语言模型,将暗网用户的属性特征、暗网用户的三度关联关系特征、关联实体的扩展属性特征嵌入到语言模型中,实现对暗网威胁用户的准确识别;最后,使用可视化界面对暗网威胁用户进行预警与推送,并展现该用户的三度关系,为决策者提供判断依据;本发明,实现了对暗网威胁用户的准确识别。
-
公开(公告)号:CN114090901A
公开(公告)日:2022-02-25
申请号:CN202111367617.3
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/9536 , G06F16/35 , G06K9/62 , G06Q30/06
Abstract: 本发明提供一种基于多模融合特征的暗网相似商品判定方法、存储介质及计算装置,所述方法包括:步骤10,采集暗网商品数据并对商品分类;其中,采集的暗网商品数据包括商品文字和商品图片,并对采集的商品图片生成md5值;步骤20,基于步骤1中采集的暗网商品数据以及商品分类结果,计算商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值;步骤30,基于商品图片的md5值、商品图片的感知哈希指纹值以及商品文字的Word2Vec句向量值,对商品相似度进行计算。本发明通过构建一种融合商品图片和商品文本的相似度计算方法,能够解决暗网商品图片模糊,文字信息简单,相似商品的判定存在困难的问题。
-
公开(公告)号:CN114090796A
公开(公告)日:2022-02-25
申请号:CN202111367064.1
申请日:2021-11-18
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/38 , G06F16/35 , G06F16/36 , G06F40/284
Abstract: 本发明提供一种多平台文本二级标签体系搭建及完善迭代的方法,包括:S10,迭代扩充一级标签下的代表词;S20,基于代表词确定初始二级标签;S30,基于初始二级标签完成二级标签扩充与融合。本发明的有益效果是:1、本发明通过代表词语料获取,词向量模型训练,相似词提取的方式扩充代表词数量,极大地减少了人工收集的过程,并且也较大的降低了人工筛选的难度。2、本发明利用代表词聚类的方式自动化生成各代表词的标签类别,对于人工归纳二级标签提供了便利型。3、本发明使用测试文本进行二级标签的进一步扩充融合的方法除了提高了二级标签的覆盖率,对于新文本二级标签的归类和新建也提供了帮助。
-
公开(公告)号:CN117892727A
公开(公告)日:2024-04-16
申请号:CN202410288617.1
申请日:2024-03-14
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F40/289 , G06F40/216 , G06F9/54 , G06F16/903
Abstract: 本发明公开了一种实时文本数据流去重系统及方法,涉及数据去重领域,其中去重系统包括:数据输入端,所述数据输入端由用于接收与发送文本数据流的消息队列组成;数据处理端,所述数据处理端由流处理引擎组成,能够按不同语种对文本数据进行预处理,并基于改进Ksentence进行文本标识计算,最后形成输出数据流;数据输出端,所述数据输出端能够将数据处理端的输出数据流存储至对应的数据库中;并以此提出了一种去重方法;本发明,侧重于对海量性、实时性的文本进行去重,适用于在线实时场景。
-
公开(公告)号:CN114124467A
公开(公告)日:2022-03-01
申请号:CN202111271019.6
申请日:2021-10-29
Applicant: 中国电子科技集团公司第三十研究所
Abstract: 本发明公开了一种开放网络模式下FreeNet匿名流量检测方法及系统,其中检测方法包括:数据采集:使用网络抓包工具采集流量数据,获取待识别的流量文件,并存为pcap格式的流量文件;数据预处理:过滤广播流量和ICMP协议流量,提取出会话的五元组信息与有效载荷数据,存为json格式的会话数据;特征提取:基于所述会话数据,提取会话中的特征并形成特征数据集,所述特征包括最大包长度、最小包长度、传输协议、端口个数和报文熵值;FreeNet流量检测:基于所述特征数据集,筛选出可能的FreeNet流量,输出其五元组信息。本发明基于规则策略匹配的方法对FreeNet流量进行检测,计算复杂度低,检测速度快。
-
公开(公告)号:CN118394955B
公开(公告)日:2024-09-27
申请号:CN202410840949.6
申请日:2024-06-27
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F16/36 , G06F16/33 , G06F40/295 , G06F16/901 , G06N5/02 , G06N20/00
Abstract: 本发明公开了一种结合AI Agent的暗网领域知识图谱构建与检索的方法及系统,该方法包括根据暗网领域的专家知识,构建本体,定义实体类型、实体属性、关系类型、关系属性;从对暗网贴文中抽取实体和关系;通过AI Agent对提取的实体和关系进行数据增强;响应用户的查询并生成对应的检索内容。本发明实现了对暗网数据的高效抽取、实体信息智能扩展和暗网内容精准检索。
-
公开(公告)号:CN118233221A
公开(公告)日:2024-06-21
申请号:CN202410649771.7
申请日:2024-05-24
Applicant: 中国电子科技集团公司第三十研究所 , 中国电子科技集团有限公司电子科学研究院
Abstract: 本发明提供一种基于熵的网络攻防不确定性度量计算方法,涉及网络攻防对抗技术领域,解决了如何准确度量计算攻击方红队人员达成验证目标的不确定性问题;方法包括:构建包括目标系统的安全验证过程刻画模型;基于模型,形式化定义达到验证目的的不确定性度量,将“从攻击方视角对目标系统成功实施攻击验证其安全性缺陷的不确定性度量”记为攻击熵,进而得到基于多维状态分量的计算公式;依据状态分量之间的相关性,对攻击熵进行分解,计算对应的状态分量的概率分布,代入攻击熵计算公式,得到在整个攻击过程任意阶段,攻击方视角下能否成功实施攻击的不确定性度量;本发明能在网络攻防演练过程中,准确刻画攻击方视角下演练验证结果的不确定性。
-
公开(公告)号:CN117892727B
公开(公告)日:2024-05-17
申请号:CN202410288617.1
申请日:2024-03-14
Applicant: 中国电子科技集团公司第三十研究所
IPC: G06F40/289 , G06F40/216 , G06F9/54 , G06F16/903
Abstract: 本发明公开了一种实时文本数据流去重系统及方法,涉及数据去重领域,其中去重系统包括:数据输入端,所述数据输入端由用于接收与发送文本数据流的消息队列组成;数据处理端,所述数据处理端由流处理引擎组成,能够按不同语种对文本数据进行预处理,并基于改进Ksentence进行文本标识计算,最后形成输出数据流;数据输出端,所述数据输出端能够将数据处理端的输出数据流存储至对应的数据库中;并以此提出了一种去重方法;本发明,侧重于对海量性、实时性的文本进行去重,适用于在线实时场景。
-
-
-
-
-
-
-
-
-