-
公开(公告)号:CN114492387A
公开(公告)日:2022-05-13
申请号:CN202210401179.6
申请日:2022-04-18
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/211 , G06F40/284 , G06F40/237 , G06N20/00
Abstract: 本发明公开一种基于句法结构的领域自适应方面术语抽取方法及系统,包括将源领域和目标领域中词的词性和句法依赖关系作为句法结构信息;计算源领域方面术语的平均词性特征和平均句法依赖关系特征并作为方面术语的平均句法结构特征;根据句法结构信息计算源领域和目标领域中每个词和平均句法结构特征的相似度;对基于Transformer的预训练模型进行基于句法结构相似度的再预训练;基于掩码语言模型MLM构建方面术语抽取模型并进行训练,训练过程中对术语抽取模型的交叉熵损失函数进行加权。本发明能学习到词语级领域不变表征,在细粒度的文本抽取任务中能取得不错的成效。
-
公开(公告)号:CN112988981A
公开(公告)日:2021-06-18
申请号:CN202110525248.X
申请日:2021-05-14
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
Abstract: 本发明提供了一种基于遗传算法的自动标注方法,包括依次执行以下步骤:步骤1,预处理:获取评论,从评论中删除长度小于两个单词的评论和所有非字母数字字符,然后取小写字母,在标记化后剔除存在于NLTK语料库中的终止词,接下来,将单词简化为词根形式;步骤2,主题建模:采用LDA主题建模方法,给定一个评论列表R={r1,r2,…,rn},获得相应的词汇D={ω1,ω2,...,ωd},话题β={β1,β2,...,βk};步骤3,基于遗传算法的主题标注:设计适合该主题标注场景的染色体结构、适应度参数以及遗传算子。本发明的有益效果是:利于开发者和用户了解应用评论。
-
公开(公告)号:CN119248289B
公开(公告)日:2025-05-16
申请号:CN202411775766.7
申请日:2024-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F8/41
Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。
-
公开(公告)号:CN119854037A
公开(公告)日:2025-04-18
申请号:CN202510322615.4
申请日:2025-03-19
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04L9/40 , H04L67/12 , H04L67/2885 , H04L41/0631 , H04L41/14 , H04L41/16 , G06N3/0464 , G06N3/0442
Abstract: 本申请提供一种道路交通网络异常检测方法、装置、电子设备及存储介质,所述方法应用于云边协同交通网络系统,包括:设备层、边缘计算层和云计算层;所述方法包括:利用设备层采集网络流量数据,并将网络流量数据发送至边缘计算层;利用边缘计算层下载的异常检测模型对网络流量数据进行分类,确定正常流量和异常流量,并将异常流量发送至云计算层;异常检测模型预设于云计算层;利用云计算层预设的深度学习模型识别异常流量的攻击技术,根据攻击技术结合ATT&CK框架确定攻击路径图;利用攻击路径图确定攻击链,根据攻击路径图及攻击链确定攻击目标和攻击源。通过云边协同架构,分层处理网络流量数据的分类和攻击行为识别。
-
公开(公告)号:CN119248289A
公开(公告)日:2025-01-03
申请号:CN202411775766.7
申请日:2024-12-05
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F8/41
Abstract: 本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。
-
公开(公告)号:CN116318929B
公开(公告)日:2023-08-29
申请号:CN202310206593.6
申请日:2023-03-07
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: H04L9/40 , H04L41/0631 , H04L41/16
Abstract: 本发明涉及网络安全技术领域,特别涉及一种基于安全告警数据的攻击策略抽取方法。其方法包括以下步骤:S1.从告警文本中获取攻击者的单步攻击信息;S2.构建攻击活动序列集;S3.构建候选攻击策略;S4.构建攻击策略数据集;S5.预训练;S6.模型训练;S7.攻击策略抽取;S8.人工验证。本方法通过训练模型来判断攻击者的一个候选攻击策略是否为全部的有效攻击步骤,并且这些攻击步骤的组合能完成攻击者的攻击目的;通过这个模型,能够使用枚举候选攻击策略的方式关联出攻击者的全部有效攻击步骤,组成攻击者的攻击策略,而无需定义大量的关联规则;而且在过去的关联经验中未被关联的两个告警也可能被本方法所关联。
-
公开(公告)号:CN115983379A
公开(公告)日:2023-04-18
申请号:CN202310265601.4
申请日:2023-03-20
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N5/01 , G06N5/02 , G06N3/0464 , G06N3/084
Abstract: 公开了一种MDATA知识图谱的可达路径查询方法及其系统,其首先基于大型网络中的IP关联性构建通信图和实际场景下网络中节点之间的通信关系构建MDATA知识图谱,接着计算MDATA知识图谱的强连通子图和所述强连通子图中心顶点,并以中心顶点为核心构建节点的两跳标签索引,继而基于两条标签索引查询节点间的可达路径以实现快速查询来自不同强连通子图的两个节点的可达性与路径关系。同时,依据存储的事件时间对可达路径进行筛选以过滤掉不符合事件发展顺序的无效路径,从而保存攻击者实际采用的攻击路径和采用的操作,最终能够结合模式匹配的方法依据操作的时序关系和路径分析出攻击者选用的攻击方式从而采取防御措施。
-
公开(公告)号:CN114723071B
公开(公告)日:2023-04-07
申请号:CN202210450751.8
申请日:2022-04-26
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06N20/00 , G06F18/241
Abstract: 本发明公开了一种基于客户端分类和信息熵的联邦学习方法及装置,涉及机器学习技术领域,该方法包括:基于客户端在非独立同分布数据场景的偏置程度,将客户端归入第一服务器或第二服务器;在相对应的服务器中训练客户端,得到训练好的客户端模型,并确定客户端模型的本地模型参数,并基于本地模型参数对应的更新第一服务器的第一模型参数和第二服务器的第二模型参数;确定第一服务器和第二服务器满足交互条件,基于第一模型参数和第二模型参数分别对应的权重,更新中央服务器的中央模型参数。本发明可以提升联邦学习的模型准确率,使得联邦学习适用于在不同混合程度的Non‑IID场景。
-
公开(公告)号:CN115828269A
公开(公告)日:2023-03-21
申请号:CN202310115880.6
申请日:2023-02-15
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F21/57 , G06F21/56 , G06N3/08 , G06N3/0442 , G06N3/045
Abstract: 本公开提供了一种源代码漏洞检测模型的构建方法、装置、设备及存储介质,通过构建代码结构图,所述代码结构图包括节点、边信息、节点类型以及边类型;基于所述代码结构图构建元路径图,其中,所述元路径图中的元路径用于代表由边信息连接的源节点到目标节点的异构关系;基于元路径注意力机制学习所述元路径图中各个元路径的异构关系,以及基于分层注意力机制学习超过预设距离的节点之间的依赖关系,从而使得图神经网络能够学习代码的语法结构信息,提升代码漏洞检测的性能。
-
公开(公告)号:CN114429109A
公开(公告)日:2022-05-03
申请号:CN202210354868.6
申请日:2022-04-06
Applicant: 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)
IPC: G06F40/169 , G06K9/62
Abstract: 本发明提供了一种基于评论有用性的自动用户评论摘要的方法,包括依次执行以下步骤:步骤1:预处理;对评论文本进行词形还原;步骤2:评论有用性预测;提取可能会影响评论有用性的特征,用所提取的特征来刻画评论,并使用随机森林分类模型预测评论的有用性;步骤3:基于二元词语的情感‑话题建模;向传统二元词语话题模型中加入情感变量,为评论同时建模话题和情感;步骤4:多要素话题和评论排序。本发明的有益效果是:1.本发明的方法可有效利用一些忽略的重要的评论特征辅助评论有用性预测、辅助后续的排序摘要任务;2.本发明的方法的话题的排序可以节约开发者的时间。
-
-
-
-
-
-
-
-
-