-
公开(公告)号:CN104765884B
公开(公告)日:2018-06-22
申请号:CN201510213462.6
申请日:2015-04-30
Applicant: 哈尔滨工业大学
Abstract: 本申请涉及一种HTTPS网页的指纹提取方法和指纹识别方法,指纹提取方法包括:根据待处理HTTPS网页的数据流,获得待处理HTTPS网页的多个对象各自的密文长度和加密方式;根据待处理HTTPS网页的多个对象各自的密文长度和加密方式,获得多个对象各自的明文长度区间,以确定每个对象的信息,其中每个对象的信息包括该对象对应的最大长度、最小长度和平均长度;以及利用待处理HTTPS网页的多个对象各自的信息,构建待处理HTTPS网页的指纹。指纹识别方法包括:通过提取待识别HTTPS网页的对象信息,与HTTPS网页指纹库中的信息进行匹配,完成识别。本发明的指纹提取方法和指纹识别方法,可行性强,识别准确率高。
-
公开(公告)号:CN104615935B
公开(公告)日:2017-06-20
申请号:CN201510096205.9
申请日:2015-03-04
Applicant: 哈尔滨工业大学
IPC: G06F21/55
Abstract: 一种面向Xen虚拟化平台的隐藏方法,本发明涉及Xen虚拟化平台的隐藏方法。本发明为了解决现有技术中基于Xen的蜜罐收集黑客攻击行为信息的准确率低的问题。通过以下三个步骤进行:一、通过重写运行有Xen虚拟化平台的Linux系统的命令,从命令级别隐藏了Xen虚拟化信息;二、通过对运行有Xen虚拟化平台的Linux系统日志/var/log/下文件进行加密,从日志级别隐藏了Xen虚拟化信息;三、通过对运行有Xen虚拟化平台的Linux系统的内核代码procfs下文件和sysfs下文件读取函数进行修改,隐藏了Xen虚拟化信息;至此,完成了对Xen虚拟化平台的隐藏。本发明应用于信息安全领域。
-
公开(公告)号:CN102270240A
公开(公告)日:2011-12-07
申请号:CN201110231560.4
申请日:2011-08-15
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明提供了一种网络论坛中热点发现及其演化态势分析方法,利用爬虫程序提取一个版块内所有帖子的HTML文本;从每个帖子文本中抽取浏览量和回复量构成二元组,设第i个帖子的二元组为(xi,yi);利用公式计算第i个帖子的得分;取得一个热度帖,根据回复记录统计自主题发布以来到抓取时每天发生的回复数得到二元组。下面列出拟合的效果以及评价指标:SSE=1.548e+07。SSE为误差项平方和,反映每个样本各观测值的离散状况,又称为组内平方和或残差平方和。R-square=0.8339。R-square是拟合系数,值越大拟合度越好。RMSE=525.7。RMSE为均方根误差,可以作为衡量测量精度的一种数值指标。对这些指标分析后,可以看出拟合的效果是比较理想的。求出最大的极值点为x0=14;取x1=15>x0,y′(x0)<0故该帖子的热度正在下降。
-
公开(公告)号:CN102184205A
公开(公告)日:2011-09-14
申请号:CN201110107502.0
申请日:2011-04-28
Applicant: 哈尔滨工业大学
IPC: G06F17/30
Abstract: 本发明公开了一种基于可扩展精度混沌哈希的多模式串匹配算法。算法中主要数据结构:带有控制状态信息的字符表,模式经过基于可扩展精度混沌哈希函数映射的哈希表,多模式长度信息的窗口信息。步骤为:1、预处理阶段,模式经过哈希处理保存到带有控制状态信息字符表为入口的哈希表中;2、在模式匹配过程中以文本的任意位置的字符开始的窗口为单位;对当前窗口内的子窗口依次进行哈希处理,通过字符表的控制状态信息访问哈希表,把子窗口内的文本与具有该哈希值的模式进行比较;匹配成功则输出相关信息;3、顺序扫描文本,直到文本末尾。本发明适合并行化以及模式数据量大和模式长度集中的串匹配算法,可应用于使用多模式串匹配方法的技术领域。
-
公开(公告)号:CN101783752A
公开(公告)日:2010-07-21
申请号:CN201010108420.3
申请日:2010-02-10
Applicant: 哈尔滨工业大学
Abstract: 一种基于网络拓扑特征的网络安全量化评估方法,它涉及网络安全技术领域,它解决了现有的网络安全量化评估过程中忽略网络拓扑特征的问题。本发明的过程为:步骤一:选取用于评估网络安全事件损害程度的网络性能指标;步骤二:定义网络熵值Hi=-log2Vi;步骤三:计算每一个网络性能指标的指标权重;步骤四:利用格兰姆-施密特正交化方法去除多个网络性能指标间的相关性,获得多个去相关网络性能指标;步骤五:获得安全事件损害程度ΔH和安全事件损害等级;步骤六:利用析因设计方法并结合安全事件损害程度ΔH,实现量化网络拓扑特征进行评估网络安全事件对网络性能的影响程度。本发明为指导网络安全宏观预警与响应提供了参考信息。
-
公开(公告)号:CN119150869B
公开(公告)日:2025-04-15
申请号:CN202411190952.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/09
Abstract: 本发明公开了一种区分网络安全数据命名实体识别难易度的方法,属于网络数据安全技术领域。解决了现有技术中传统的命名实体识别方法难以有效区分数据难易度的问题;本发明包括以下步骤:S1.构建基于规则的判别器,输入数据集,通过难度指标评估句子中实体的复杂性,得到总难度分数,对数据集中的数据进行分类,得到分类结果;S2.构建预训练模型,设置基于预训练模型的数据判别器对分类结果进行验证,得到最终的命名实体识别分类结果。本发明有效提升了识别数据集中具有挑战性的实例的整体准确性,能够区分数据难易度,增强了数据分类结果的鲁棒性,减轻了预训练模型特定的偏差,可以应用于网络安全数据处理。
-
公开(公告)号:CN119226592A
公开(公告)日:2024-12-31
申请号:CN202411384312.7
申请日:2024-09-30
Applicant: 哈尔滨工业大学 , 黑龙江省网络空间研究中心(黑龙江省信息安全测评中心、黑龙江省国防科学技术研究院)
IPC: G06F16/953 , G06Q50/00 , G06F40/289 , G06F40/284 , G06F18/2411 , G06F18/243 , G06F18/23 , G06F18/22
Abstract: 本发明公开了基于潜在传播集的社交网络异常信息传播跟踪系统,涉及社交网络安全技术领域。为了解决现有技术中,可能存在主观性和误差,影响传播参数的提取和调整,从而影响预测的准确性,且需要人工干预来预测网络热点消息的传播情况,限制了其在自动预测和监控方面的能力的问题;基于潜在传播集的社交网络异常信息传播跟踪系统,包括数据采集单元、潜在传播集生成单元、传播路径跟踪单元和预警单元;通过分析社交网络中节点的互动关系和信息传播规律,识别出潜在传播集,利用潜在传播集来预测和追踪信息的传播路径,从而及时发现和应对异常信息的传播,帮助企业和组织及时发现和处理异常信息,维护网络空间的健康和安全。
-
公开(公告)号:CN119204011A
公开(公告)日:2024-12-27
申请号:CN202411190945.4
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种基于预训练模型的网络安全命名实体识别数据增广方法,属于网络数据安全技术领域。解决了现有技术中传统的网络安全命名实体识别数据增广方法易导致识别文本语义错误的问题;本发明给定标注集合和输入序列,根据标注规则生成标注序列,对输入序列进行分句处理;对输入序列的文本片段的长度进行替换,得到片段集合;根据标注集合,对片段集合进行掩码操作,得到新片段集合,利用BERT模型对新片段集合进行预测,得到增广后的数据集;使用BERT模型计算得到连续概率并搜索相邻句子概率矩阵打乱句子顺序,得到最终增广后的数据集。本发明有效提升了所生成增广数据的质量,减少了过拟合现象,可以应用于数据增广。
-
公开(公告)号:CN119167936A
公开(公告)日:2024-12-20
申请号:CN202411190960.9
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06F16/35 , G06N3/0455 , G06N3/045 , G06N3/08
Abstract: 基于BERT预训练模型的网络安全NER数据增广方法、电子设备及存储介质,属于网络安全数据处理技术领域。为提高网络安全数据的效率和准确度,本发明采集网络空间安全报告,得到网络空间安全数据;使用BIO方法标注采集的网络空间安全报告,得到的文本序列和标签序列,作为原始数据集;构建BERT预训练模型;将网络空间安全数据进行掩码处理,然后输入到BERT预训练模型中进行训练,得到用于网络安全NER数据的BERT训练模型;将原始数据集进行掩码处理,输入到用于网络安全NER数据的BERT训练模型,将得到的用于网络安全NER数据的BERT训练结果和步骤S2得到的原始数据集进行合并后得到增广数据集。
-
公开(公告)号:CN113992730B
公开(公告)日:2024-09-06
申请号:CN202111254268.4
申请日:2021-10-27
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: H04L67/1396 , G06N3/08 , G06N3/0455
Abstract: 本发明提出一种基于知识构建的用户行为模拟方法、模拟系统、定制系统、计算机及存储介质,属于行为模拟技术领域。首先,捕获网络节点用户行为数据;所述用户行为数据包括采集键鼠操作数据和应用程序事件操作数据;其次,根据键鼠操作数据和应用程序事件操作数据生成状态‑操作元序列,学习状态‑操作元序列生成用户行为模拟操作序列;最后,根据用户行为模拟操作序列模拟键鼠操作,生成键鼠操作模拟程序。本发明解决现有技术中存在的网络流量模拟的真实性不足的技术问题。实现了对真实网络用户的行为模拟,从而生成仿真度高的网络流量。
-
-
-
-
-
-
-
-
-