-
公开(公告)号:CN110610005A
公开(公告)日:2019-12-24
申请号:CN201910870274.9
申请日:2019-09-16
Applicant: 哈尔滨工业大学
Abstract: 基于深度学习的盗窃罪辅助量刑方法属于计算机领域;无法实现在较少人工标注情况下的案情语义表示和特定罪名的刑期精准预测;包括根据刑法规定和关于盗窃罪的量刑规定,结合已公开的盗窃罪一审判决书,从被盗窃物品价值、犯罪主体信息、犯罪事实描述、判决结果角度定义形式化描述盗窃案的11维特征;对裁判文书进行文本预处理;整合为语料集,训练词向量;完成除被盗窃物品价值和刑期之外特征的提取,使用循环神经网络为每一维特征分别构建特征生成器,从而提取特征值;使用线性回归和多层神经网络模型作为预测器,输入案件特征向量,输出刑期预测结果;能够在较少依赖人工标注的情况下实现对案情的深度语义理解和给出明确的刑期预测值。
-
公开(公告)号:CN109218441A
公开(公告)日:2019-01-15
申请号:CN201811215367.X
申请日:2018-10-18
Applicant: 哈尔滨工业大学
IPC: H04L29/08 , H04L12/24 , H04L12/26 , H04L12/733 , H04L12/803
Abstract: 一种基于预测和区域划分的P2P网络动态负载均衡方法属于网络文件传输领域;包括获取节点资源利用率;判断节点资源利用率是否超过高负载区阈值,若是,执行步骤e,若否,执行步骤c;根据节点当前文件访问情况预测接下来的访问量;判断文件是否成为热点文件,若是,执行步骤e,若否,执行步骤a;向周围节点广播获取周围节点负载信息;判断是否处在高负载区域,若是,执行高负载区域负载均衡模块,若否,执行低负载区域负载均衡模块;服务器建立热点文件副本,进行步骤a;本发明能够很好地实现实际系统网络的负载均衡。
-
公开(公告)号:CN104615936B
公开(公告)日:2018-03-30
申请号:CN201510096203.X
申请日:2015-03-04
Applicant: 哈尔滨工业大学
Abstract: 云平台VMM层行为监控方法,本发明涉及云平台VMM层行为监控方法。本发明是要解决现有技术的问题主要在于:运行环境不安全,可能被攻破、算法安全监控程序占用的系统资源大、识别异常率不高的问题。云平台VMM层行为监控方法,它包括:用于VMM层劫持系统调用并获得系统调用序列的System Call Interpcepter步骤;用于分析系统调用序列并判断进程异常与否的System Call Analyze步骤;用于接收System Call Analyzer模块的分析结果并发出警报提醒操作系统的System Call Handler步骤。本发明应用于云平台领域。
-
公开(公告)号:CN119272770B
公开(公告)日:2025-05-16
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN119996065A
公开(公告)日:2025-05-13
申请号:CN202510401906.2
申请日:2025-04-01
Applicant: 哈尔滨工业大学
IPC: H04L9/40 , H04L61/4511 , G06N3/088
Abstract: 本发明公开了一种DNS隧道检测方法,属于安全通信技术领域。解决了现有技术中传统的DNS隧道检测方法难以检测低吞吐DNS隧道和分布式DNS隧道的问题;本发明使用设定的第一聚合键对数据包进行聚合,并使用自编码器进行初步检测与评分,对常规DNS隧道进行检测;使用设定的第二聚合键和第三聚合键分别对一阶聚合的元数据再次进行聚合,分别从通信对象与域名维度对低吞吐DNS隧道和分布式DNS隧道进行检测;将三个自编码器的评分送入一个作为非线性投票机制的自编码器,最后非线性投票机制根据三个聚合键下数据的评分做出最终判断,得到检测结果。本发明有效提升了DNS隧道检测的全面性,可以应用于检测分布式DNS隧道。
-
公开(公告)号:CN119272770A
公开(公告)日:2025-01-07
申请号:CN202411190943.5
申请日:2024-08-28
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F40/16 , G06N3/045 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于注意力机制优化的网络数据命名实体识别方法,属于命名实体识别的预训练模型优化技术领域。解决了现有技术中传统的网络数据命名实体识别方法因未考虑网络安全数据特点导致的识别结果精度较低的问题;本发明给定输入序列,将其输入BERT模型,生成三种嵌入并进行相加,得到词的最终输入,输入到引入BERT模型的Transformer‑XL模型,设置基础矩阵,引入内容嵌入矩阵和位置嵌入矩阵,得到内容嵌入基础矩阵和位置嵌入基础矩阵;获得句子中任意两个单词之间的注意力机制分数,对所有注意力机制分数的加和进行归一化,得到归一化后的注意力机制分数。本发明有效提升了命名实体识别的精度,可以应用于实体识别。
-
公开(公告)号:CN118734846A
公开(公告)日:2024-10-01
申请号:CN202410745744.X
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F40/284 , G06F40/216 , G06F16/33 , G06F16/335 , G06F16/35 , G06Q50/18
Abstract: 本发明提出一种法律文本知识提取方法,属于法律文本知识提取技术领域。包括:对待提取文本进行分词操作,将每个类别中的所有文档聚合成一个长文本,过滤法律停用词,生成每个类别关键词集合;搜索每个类别中与原类别共有关键词最多的相似类别加入关键词集合中;筛选每个类别和其相似类别中的独有关键词和共有关键词加入关键词集合中,以及筛选独有关键词和共有关键词中的偏置词加入关键词集合中。为了解决缺少法律领域的知识提取法方法的问题,本发明分别给出了基于人工干涉的知识提取方案以及无需人工干涉的自动化知识提取方案,对准确性和效率需求不同的场景提供个性化解决方案。
-
公开(公告)号:CN118733767A
公开(公告)日:2024-10-01
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/35 , G06F16/33 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
公开(公告)号:CN118585779A
公开(公告)日:2024-09-03
申请号:CN202410688597.7
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F18/21 , G06F18/214 , G06F40/284 , G06F40/242 , G06F40/247
Abstract: 本发明提出基于ORS面向软标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;为输出为软标签的目标模型的鲁棒性评估提供了一种可行的解决方案,解决了当前鲁棒性评估方法中评价指标不全面的问题,并量化了输出为软标签的深度学习模型的鲁棒性评估标准。
-
公开(公告)号:CN117436449B
公开(公告)日:2024-07-09
申请号:CN202311442418.3
申请日:2023-11-01
Applicant: 哈尔滨工业大学
IPC: G06F40/295 , G06F16/35 , G06N3/0464 , G06N3/0442 , G06N3/0455 , G06N3/047 , G06N3/084 , G06N3/092
Abstract: 一种基于多源域适应和强化学习的众包命名实体识别模型及系统,属于众包命名实体识别技术领域。本发明为了解现有的使用域适应模型解决众包问题的方法往往没有充分考虑标注者的可靠性导致低质量标注者的数据对模型训练产生负面影响、以及现有众包命名实体识别方法在处理低质量标注者提交的极低质量数据时存在困难等问题。通过考虑标注者可靠性生成合成的专家表示,并采用基于强化学习的实例选择器丢弃低质量的标注,从而提高命名实体识别模型在众包数据集上的性能,本发明加深了对众包命名实体识别领域适应方法中标注者可靠性的理解,提出了一种基于强化学习的数据预处理实例选择器,并展示了其在解决众包标注中的命名实体识别挑战方面的有效性。本发明用于在无监督众包数据中高效地提取命名实体信息。
-
-
-
-
-
-
-
-
-