-
公开(公告)号:CN119597915A
公开(公告)日:2025-03-11
申请号:CN202411638173.6
申请日:2024-11-16
Applicant: 南开大学
IPC: G06F16/35 , G06F40/16 , G06F40/30 , G06F40/295 , G06N3/045
Abstract: 本发明属于自然语言处理领域,特别是涉及一种基于结构化语义知识增强的数据识别方法。该方法包括:1)将经过处理和清洗后的数据集文本输入到文本编码器中,获得文本特征向量。2)对于经过处理和清洗后的数据集文本,使用基于Transformer的自动抽象语义表示解析器来获得相应的抽象语义表示图。在获得抽象语义表示图之后,通过确定性拓扑增强和概率性拓扑增强策略生成内聚子图,3)采用图编码器从抽象语义表示图和它们的内聚子图中提取相应的图特征向量。4)采用对比学习区分具有不同相似度的图文对。5)得到训练模型后,通过抽取事件测试效果。
-
公开(公告)号:CN117892305A
公开(公告)日:2024-04-16
申请号:CN202410088252.8
申请日:2024-01-22
Applicant: 南开大学
IPC: G06F21/56 , G06F18/24 , G06N3/0442 , G06F123/02
Abstract: 本发明属于计算机技术领域,特别是涉及基于硬件性能计数器时序数据的恶意软件检测方法。使用Linux系统提供的Perf工具集提供的perf stat命令,从Linux系统的Linux容器中获取恶意软件和良性软件的硬件性能计数器时序数据;利用python程序对上一步所取得的硬件性能计数器时序数据进行预处理:将原始时序数据进行数据清洗并以csv文件形式保存。将预处理之后的硬件性能计数器时序数据输入长短期记忆递归神经网络中进行训练,获得最终的恶意软件检测模型。并使用SHAP值对恶意软件检测模型的分类结果进行解释,获取贡献度高的时间片和硬件性能计数器特征,再使用Linux系统提供的Perf工具集,从Linux系统的Linux容器中获取恶意软件和良性软件的系统调用时序数据。
-