-
公开(公告)号:CN112464627A
公开(公告)日:2021-03-09
申请号:CN202011225399.5
申请日:2020-11-05
Applicant: 北京科技大学
IPC: G06F40/169
Abstract: 本发明公开了一种面向共指关系的手动文本标注工具及方法,该工具包括存储模块和标注模块,存储模块用于存储语料文本、节点和实例;其中,每一节点存储一个指称和用于标注当前节点指向哪个实例的节点标注信息,每一实例存储一个实例信息和用于标注当前实例被哪些节点所指向的实例标注信息;标注模块用于以可视化图形界面的方式为用户提供操作界面,并根据用户操作指令在操作界面上展示当前待标注的语料文本和当前指称,为当前指称确定对应的当前节点,并为当前节点确定对应的实例。本发明可一次性实现跨文档的共指标注,无需先标注文档内共指信息,再聚合文档间共指信息,提高了效率。
-
公开(公告)号:CN115204258A
公开(公告)日:2022-10-18
申请号:CN202210648545.8
申请日:2022-06-09
Applicant: 北京科技大学
Abstract: 本发明公开了一种网络加密流量分层分类方法及装置,该方法包括:获取流量数据并存入原始流量数据集中;对现有网络协议加密流量分层分类模型进行分析,选择一个未完成全部加密网络协议分类的节点,从原始流量数据集中提取出相应未分类流量数据,构建训练数据集;以训练数据集训练分类模型,将训练所得的分类模型参数保存至现有网络协议加密流量分层分类模型中,并保存对流量数据的预处理步骤;基于用户分类需求,利用已训练分层分类模型进行加密流量分类。本发明解决了高速网络环境中,用户需求不断变化过程中,如何对多个协议流量混合的复杂网络流量,按照协议的不同进行分类的问题。
-
公开(公告)号:CN114970680A
公开(公告)日:2022-08-30
申请号:CN202210459253.X
申请日:2022-04-26
Applicant: 北京科技大学
Abstract: 本发明公开了一种基于CNN+LSTM的流量终端实时识别方法及装置,该流量终端实时识别方法包括:对传输控制协议TCP会话进行重组;从会话中提取流量特征,并对提取出的流量特征进行预处理;构建卷积神经网络CNN与长短记忆神经网络LSTM结合的深度学习模型;以预处理后的流量特征为样本,终端信息为标签,构建样本数据集;采用迁移学习的方式,利用所述样本数据集对所述模型进行训练,得到分类器;利用训练后的分类器进行流量分类与标记。本发明的流量终端实时识别方法以CNN+LSTM为基础,利用迁移学习的思想。通过对流量统计特征以及流量useragent特征的学习,实现了流量终端实时分类。
-
公开(公告)号:CN112464627B
公开(公告)日:2021-12-03
申请号:CN202011225399.5
申请日:2020-11-05
Applicant: 北京科技大学
IPC: G06F40/169
Abstract: 本发明公开了一种面向共指关系的手动文本标注工具及方法,该工具包括存储模块和标注模块,存储模块用于存储语料文本、节点和实例;其中,每一节点存储一个指称和用于标注当前节点指向哪个实例的节点标注信息,每一实例存储一个实例信息和用于标注当前实例被哪些节点所指向的实例标注信息;标注模块用于以可视化图形界面的方式为用户提供操作界面,并根据用户操作指令在操作界面上展示当前待标注的语料文本和当前指称,为当前指称确定对应的当前节点,并为当前节点确定对应的实例。本发明可一次性实现跨文档的共指标注,无需先标注文档内共指信息,再聚合文档间共指信息,提高了效率。
-
-
-