-
公开(公告)号:CN119150869B
公开(公告)日:2025-04-15
申请号:CN202411190952.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种区分网络安全数据命名实体识别难易度的方法,属于网络数据安全技术领域。解决了现有技术中传统的命名实体识别方法难以有效区分数据难易度的问题;本发明包括以下步骤:S1.构建基于规则的判别器,输入数据集,通过难度指标评估句子中实体的复杂性,得到总难度分数,对数据集中的数据进行分类,得到分类结果;S2.构建预训练模型,设置基于预训练模型的数据判别器对分类结果进行验证,得到最终的命名实体识别分类结果。本发明有效提升了识别数据集中具有挑战性的实例的整体准确性,能够区分数据难易度,增强了数据分类结果的鲁棒性,减轻了预训练模型特定的偏差,可以应用于网络安全数据处理。
-
公开(公告)号:CN116775127A
公开(公告)日:2023-09-19
申请号:CN202310598471.6
申请日:2023-05-25
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于RetroWrite框架的静态符号执行插桩方法,属于计算机技术领域。解决了现有技术中符号执行插桩方法在闭源程序运行时开销较大的问题;本发明包括以下步骤:S1.访问闭源的C/C++程序中的各个用户自定义函数;S2.访问函数中的各个基本块;S3.顺序访问指令;S4.进行指令级插桩,为赋值、调用、运算和条件类指令进行功能插桩;S5.进行基本块插桩,在基本块的出口进行辅助插桩;S6.进行函数级插桩,在函数的入口和出口进行辅助插桩。本发明面向闭源程序通用高效,有效降低了运行时非求解开销,在扩展使用范围的同时,提高了混合模糊测试的速度,可以应用于软件测试。
-
公开(公告)号:CN118734846B
公开(公告)日:2025-01-14
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/3332 , G06F16/334 , G06F16/335 , G06F16/35 , G06Q50/18 , G06N5/022
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
公开(公告)号:CN119167935A
公开(公告)日:2024-12-20
申请号:CN202411190954.3
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/211 , G06F16/33 , G06N3/0442 , G06N3/08
Abstract: 基于提示学习思想的网络安全命名实体识别模型构建方法、电子设备及存储介质,属于网络安全命名实体识别技术领域。为解决提取信息在面对具体的网络安全实体识别任务时直接应用的问题,本发明采集网络安全数据,得到网络空间安全数据序列,基于标注规则设置标注集合、生成标注序列,所述标注规则包括被标注数据的实体类型及被标注数据不属于任何实体;基于标注规则,对网络空间安全数据序列进行分割处理,然后对应生成标注子序列,得到处理后的网络空间安全数据;定义数据增广规则,对处理后的网络空间安全数据进行数据增广,得到数据增广的网络空间安全数据集;对预训练模型中进行继续预训练和微调操作,得到网络安全命名实体识别数据提取模型。
-
公开(公告)号:CN116775127B
公开(公告)日:2024-05-28
申请号:CN202310598471.6
申请日:2023-05-25
Applicant: 哈尔滨工业大学
Abstract: 本发明公开了一种基于RetroWrite框架的静态符号执行插桩方法,属于计算机技术领域。解决了现有技术中符号执行插桩方法在闭源程序运行时开销较大的问题;本发明包括以下步骤:S1.访问闭源的C/C++程序中的各个用户自定义函数;S2.访问函数中的各个基本块;S3.顺序访问指令;S4.进行指令级插桩,为赋值、调用、运算和条件类指令进行功能插桩;S5.进行基本块插桩,在基本块的出口进行辅助插桩;S6.进行函数级插桩,在函数的入口和出口进行辅助插桩。本发明面向闭源程序通用高效,有效降低了运行时非求解开销,在扩展使用范围的同时,提高了混合模糊测试的速度,可以应用于软件测试。
-
公开(公告)号:CN118607515B
公开(公告)日:2025-02-28
申请号:CN202410688627.4
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出基于ORS面向硬标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决缺少对LLM在对抗攻击条件下的鲁棒性评估的问题,并量化了其鲁棒性评估标准。
-
公开(公告)号:CN119150869A
公开(公告)日:2024-12-17
申请号:CN202411190952.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种区分网络安全数据命名实体识别难易度的方法,属于网络数据安全技术领域。解决了现有技术中传统的命名实体识别方法难以有效区分数据难易度的问题;本发明包括以下步骤:S1.构建基于规则的判别器,输入数据集,通过难度指标评估句子中实体的复杂性,得到总难度分数,对数据集中的数据进行分类,得到分类结果;S2.构建预训练模型,设置基于预训练模型的数据判别器对分类结果进行验证,得到最终的命名实体识别分类结果。本发明有效提升了识别数据集中具有挑战性的实例的整体准确性,能够区分数据难易度,增强了数据分类结果的鲁棒性,减轻了预训练模型特定的偏差,可以应用于网络安全数据处理。
-
公开(公告)号:CN116633830B
公开(公告)日:2024-01-23
申请号:CN202310597940.2
申请日:2023-05-25
Applicant: 哈尔滨工业大学
IPC: H04L43/18 , H04L9/40 , H04L41/142 , G06N3/006
Abstract: 本发明公开了一种基于萤火虫算法的种子变异操作调度方法,属于协议模糊测试技术领域。解决了现有技术中协议模糊测试整体效果不稳定的问题;本发明包括以下步骤:S1.借助萤火虫算法建立变异操作调度模型;S2.计算变异操作效能;S3.调整变异操作权重值;S4.增加变异操作奖励机制和惩罚机制;S5.运行变异操作选择算法,选择出具体变异操作。本发明变异操作调度方法可以减少或增加相应变异操作权重值,最终保证各变异操作效能值lighti数值差距不大,保障了协议模糊测试整体效果稳定,且可以实现变异操作调度较大概率选择效率更好的种子进行模糊测试,从而提高了协议模糊测试运行效率,可以应用于协议模糊测试。(56)对比文件Huhua Li;Dongyang Zhan;Tianrui Liu;Lin Ye.Using Deep-Learning-Based MemoryAnalysis for Malware Detection in Cloud.《2019 IEEE 16th International Conferenceon Mobile Ad Hoc and Sensor SystemsWorkshops (MASSW)》.2020,全文.任静敏;潘大志.一种改进的模拟退火萤火虫混合算法求解0/1背包问题.绵阳师范学院学报.2020,(02),全文.
-
公开(公告)号:CN116633830A
公开(公告)日:2023-08-22
申请号:CN202310597940.2
申请日:2023-05-25
Applicant: 哈尔滨工业大学
IPC: H04L43/18 , H04L9/40 , H04L41/142 , G06N3/006
Abstract: 本发明公开了一种基于萤火虫算法的种子变异操作调度方法,属于协议模糊测试技术领域。解决了现有技术中协议模糊测试整体效果不稳定的问题;本发明包括以下步骤:S1.借助萤火虫算法建立变异操作调度模型;S2.计算变异操作效能;S3.调整变异操作权重值;S4.增加变异操作奖励机制和惩罚机制;S5.运行变异操作选择算法,选择出具体变异操作。本发明变异操作调度方法可以减少或增加相应变异操作权重值,最终保证各变异操作效能值lighti数值差距不大,保障了协议模糊测试整体效果稳定,且可以实现变异操作调度较大概率选择效率更好的种子进行模糊测试,从而提高了协议模糊测试运行效率,可以应用于协议模糊测试。
-
公开(公告)号:CN118734846A
公开(公告)日:2024-10-01
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/33 , G06F16/335 , G06F16/35 , G06Q50/18
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
-
-
-
-
-
-
-
-