-
公开(公告)号:CN101808084A
公开(公告)日:2010-08-18
申请号:CN201010109449.3
申请日:2010-02-12
Applicant: 哈尔滨工业大学
IPC: H04L29/06
Abstract: 一种大规模网络安全事件模拟与仿真方法及控制方法,涉及网络安全事件仿真领域。解决了现有的网络安全模拟系统存在无法进行全面的安全事件模拟的问题。具体步骤如下:A、根据拓扑数据进行链路带宽和延迟的估算,获得路由节点的连接关系文件,将安全事件文件的格式转换;B、根据拓扑和并行模拟的粒度,对路由节点的连接关系文件进行划分,使其能够部署在多机并行的环境下进行并行模拟,并根据划分结果更新相应的拓扑数据文件;C、按照相应的规则生成并行模拟可用的模拟脚本,不同模拟节点上的模拟脚本相同,每个节点读取与自己有关的部分脚本,共同完成模拟任务。本发明适用于大规模的网络安全事件模拟。
-
公开(公告)号:CN119272770B
公开(公告)日:2025-05-16
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN119996065A
公开(公告)日:2025-05-13
申请号:CN202510401906.2
申请日:2025-04-01
Applicant: 哈尔滨工业大学
IPC: H04L9/40 , H04L61/4511 , G06N3/088
Abstract: 本发明公开了一种DNS隧道检测方法,属于安全通信技术领域。解决了现有技术中传统的DNS隧道检测方法难以检测低吞吐DNS隧道和分布式DNS隧道的问题;本发明使用设定的第一聚合键对数据包进行聚合,并使用自编码器进行初步检测与评分,对常规DNS隧道进行检测;使用设定的第二聚合键和第三聚合键分别对一阶聚合的元数据再次进行聚合,分别从通信对象与域名维度对低吞吐DNS隧道和分布式DNS隧道进行检测;将三个自编码器的评分送入一个作为非线性投票机制的自编码器,最后非线性投票机制根据三个聚合键下数据的评分做出最终判断,得到检测结果。本发明有效提升了DNS隧道检测的全面性,可以应用于检测分布式DNS隧道。
-
公开(公告)号:CN119272770A
公开(公告)日:2025-01-07
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN115134251B
公开(公告)日:2025-01-07
申请号:CN202210761664.4
申请日:2022-06-30
Applicant: 哈尔滨工业大学
IPC: H04L41/12 , H04L41/0823 , H04L43/0823 , H04L61/4552 , H04L61/5007 , H04L67/06 , H04L67/30
Abstract: 一种跨境云内部地理边界发现系统及方法,涉及网络拓扑探测技术领域。本发明的技术要点包括:在正常拓扑探测的基础上,针对云本身的特点进行优化,其中:前缀选取即根据云流量传输的特点选择能够较多的发现云内部地理边界的前缀进行探测,减少了探测目标数量;云地理边界识别即对于探测结果能够快速准确的分析出其中云内部的地理边界,减少了分析时间;测量状态监控即时刻监控测量点状态,观察其是否异常掉线并做出相应处理。本发明在极大程度减少了测量目标及测量时间的基础上,提高了云内部地理边界的发现率。
-
公开(公告)号:CN118734846A
公开(公告)日:2024-10-01
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/33 , G06F16/335 , G06F16/35 , G06Q50/18
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
公开(公告)号:CN118733767A
公开(公告)日:2024-10-01
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
公开(公告)号:CN118585779A
公开(公告)日:2024-09-03
申请号:CN202410688597.7
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F18/21 , G06F18/214 , G06F40/284 , G06F40/242 , G06F40/247
Abstract: 本发明提出基于ORS面向软标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;为输出为软标签的目标模型的鲁棒性评估提供了一种可行的解决方案,解决了当前鲁棒性评估方法中评价指标不全面的问题,并量化了输出为软标签的深度学习模型的鲁棒性评估标准。
-
公开(公告)号:CN117436449B
公开(公告)日:2024-07-09
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
公开(公告)号:CN118070774A
公开(公告)日:2024-05-24
申请号:CN202410353286.5
申请日:2024-03-26
Applicant: 哈尔滨工业大学
IPC: G06F40/194 , G06F40/242 , G06F40/216
Abstract: 一种基于目标信息识别的用户生成内容立场检测方法及系统,涉及社交网络数据处理技术领域。本发明为了解决现有的用户生成内容立场检测或识别方法需要花费大量人工成本去标注目标信息,并且仅有的类似方法在目标识别阶段往往需要大规模数据对模型进行训练或微调,导致样本数据质量会直接影响目标识别的性能和准确率的问题。技术要点:首先从给定社交媒体文本中抽取出具有代表性的关键词;然后通过余弦相似度计算关键词与目标集合中特定目标之间的相似度,并根据相似度将确定文本所针对的目标对象;最后基于识别出的目标对象,采用多任务BERTweet模型来检测文本与该目标对象之间的立场关系。本发明所提出的基于目标信息识别的用户生成内容立场检测方法可有效减少人工成本,从而提高了立场检测方法在实际应用中的可行性和实用性。
-
-
-
-
-
-
-
-
-