-
公开(公告)号:CN118733767B
公开(公告)日:2025-02-25
申请号:CN202410745742.0
申请日:2024-06-11
Applicant: 哈尔滨工业大学
IPC: G06F16/353 , G06F16/3332 , G06F16/334 , G06F16/335 , G06F40/216 , G06F40/284 , G06F18/214 , G06N5/045
Abstract: 本发明提出一种基于可解释扰动策略的中文法律对抗文本生成方法,属于对抗文本生成技术领域。包括:对法律文本进行法律知识提取;基于法律知识为文本中每个词语的重要性进行打分并排序;为待添加扰动的文本选择需要执行的扰动策略;执行扰动策略生成法律对抗文本。本发明解决了现有技术中存在缺少面向法律罪名分类任务的对抗文本生成方法的技术问题。本发明首先提取每类罪名的主要特征作为先验知识,然后将先验知识与强化相似标签和弱化原标签两种扰动策略结合,通过强化与原标签相似的标签的独有特征或弱化原标签自身的独有特征来生成对抗文本,这使得对抗文本的生成过程具有可解释性。
-
公开(公告)号:CN118607514B
公开(公告)日:2025-01-21
申请号:CN202410688599.6
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出一种基于OFS对抗文本流畅性评估方法,属于对抗文本流畅性评估技术领域。生成对抗文本,并使用对抗文本攻击目标模型,基于OFS计算对抗文本流畅性分数,评估对抗文本流畅性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决现有技术中存在的对抗文本流畅性评估需耗费大量人力成本的问题,并量化了流畅性评估标准。
-
公开(公告)号:CN118585779B
公开(公告)日:2024-12-27
申请号:CN202410688597.7
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F18/21 , G06F18/214 , G06F40/284 , G06F40/242 , G06F40/247
Abstract: 本发明提出基于ORS面向软标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;为输出为软标签的目标模型的鲁棒性评估提供了一种可行的解决方案,解决了当前鲁棒性评估方法中评价指标不全面的问题,并量化了输出为软标签的深度学习模型的鲁棒性评估标准。
-
公开(公告)号:CN118485181B
公开(公告)日:2024-12-20
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
公开(公告)号:CN119071197A
公开(公告)日:2024-12-03
申请号:CN202411234272.8
申请日:2024-09-04
Applicant: 哈尔滨工业大学
IPC: H04L43/0876 , H04L43/026 , H04L43/028 , H04L43/04
Abstract: 一种基于阻尼增量统计与Selenium的流量元数据提取方法,属于流量元数据提取技术领域。为解决扩充原始流量数据量,以及准确高效的提取流量元数据特征的问题,本发明包括基于Selenium生成原始流量;基于Scapy对生成的原始流量进行原始流量采集,得到原始流量文件;将得到的原始流量文件,首先进行预处理,然后进行基于深度包检测的数据包元数据提取,得到数据包级元数据;对得到的数据包级元数据,首先进行预处理,然后基于元数据聚合与阻尼增量统计生成会话元数据。本发明在流量生成过程中较好的模拟了用户在现实网络环境中的行为,提取过程中较为全面的考虑到了数据包级别与会话级别的特征元数据,并制定了快速提取的方法。
-
公开(公告)号:CN117879968B
公开(公告)日:2024-11-01
申请号:CN202410163731.1
申请日:2024-02-05
Applicant: 哈尔滨工业大学
Abstract: 本发明提出一种多维度工业网络行为异常检测方法,属于网络行为检测技术领域。包括:S1.建构多视图关联分析的行为分析模型;S2.建构多维跨域共享学习模型,以工控网络多维度视图及共享节点嵌入作为输入,以新的共享节点嵌入作为输出;S3.建构单域特定学习模型,使模型在多个维度上对异常进行评估和检测;S4.在多个维度上进行单视图特定学习,强化学习各维度上的嵌入信息,并根据各维度嵌入特征重建预测行为值,根据预测行为与实际行为的偏差计算各维度上的异常得分;S5.设置异常得分阈值,当异常得分在异常得分阈值内,进行异常告警。解决缺乏多维度识别和理解网络行为、处理高维数据的效率差的问题。
-
公开(公告)号:CN118607515A
公开(公告)日:2024-09-06
申请号:CN202410688627.4
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出基于ORS面向硬标签输出深度学习模型鲁棒性评估方法,属于鲁棒性评估技术领域。包括生成对抗文本,并使用对抗文本攻击目标模型,基于ORS计算目标模型的鲁棒性分数,评估鲁棒性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决缺少对LLM在对抗攻击条件下的鲁棒性评估的问题,并量化了其鲁棒性评估标准。
-
公开(公告)号:CN118607514A
公开(公告)日:2024-09-06
申请号:CN202410688599.6
申请日:2024-05-30
Applicant: 哈尔滨工业大学 , 安天科技集团股份有限公司
IPC: G06F40/226 , G06F40/284 , G06F40/242 , G06F40/247 , G06F18/2431 , G06N3/045 , G06N3/096 , G06N3/094
Abstract: 本发明提出一种基于OFS对抗文本流畅性评估方法,属于对抗文本流畅性评估技术领域。生成对抗文本,并使用对抗文本攻击目标模型,基于OFS计算对抗文本流畅性分数,评估对抗文本流畅性。对抗文本基于词语重要性框架生成,词语重要性框架包括排序阶段和扰动阶段。排序阶段为文本中每个词语的重要性打分,并将词语按照重要性分数由高到低进行排序,扰动阶段为词语依次添加扰动。利用文本对应的真值标签上的置信度计算重要性分数,若重要性分数大于0,则说明文本中的词语对真值标签有正向影响,即词语为文本中重要词语,反之词语为文本中非重要词语;解决现有技术中存在的对抗文本流畅性评估需耗费大量人力成本的问题,并量化了流畅性评估标准。
-
公开(公告)号:CN118553023A
公开(公告)日:2024-08-27
申请号:CN202410679789.1
申请日:2024-05-29
Applicant: 哈尔滨工业大学 , 上海浦东发展银行股份有限公司
IPC: G06V40/40 , G06V40/16 , G06V10/764 , G06V10/74 , G06V10/20 , G06V10/82 , G06N3/084 , G06N3/0895 , G06N3/0475 , G06N3/045 , G06N3/094
Abstract: 本发明提出一种人脸识别反欺骗方法,属于人脸识别反欺骗技术领域。包括:捕获识别者人脸图像;将人脸图像进行数据增强,生成两张不同与原人脸图像的增强图像;将增强的图像进行特征生成;将特征图像数据转换为特征向量数据;特征向量数据经过投影,得到两个投影特征向量;将两个投影特征向量进行拼接输入至分类头,将两个投影特征向量映射成一个得分,得分表征真实人脸的概率。本发明将数据增强与对比学习结合,增强人脸反欺骗识别的性能,有效区分真假人脸,以提升人脸识别系统的整体安全水平。解决现有技术中存在无法及时适应和识别新的攻击类型的技术问题。
-
公开(公告)号:CN118485181A
公开(公告)日:2024-08-13
申请号:CN202410663873.4
申请日:2024-05-27
Applicant: 哈尔滨工业大学
IPC: G06Q10/04 , G06F16/2458 , G06F16/29 , G06N3/0455 , G06N3/0499 , G06N3/047 , G06N3/0464 , G06N3/049 , G06Q50/26
Abstract: 一种基于时空轨迹表征挖掘的轨迹序列预测方法、电子设备及存储介质,属于城市智能计算和数据挖掘技术领域。为提高处理时序轨迹序列数据的效率和准确性,本发明包括采集时空轨迹数据,对时空轨迹数据进行预处理后,采用填充技术将所有预处理后的时空轨迹数据的长度补齐至采集的轨迹数据最长长度,然后进行掩码操作,得到掩码处理的时空轨迹数据;进行位置编码,得到位置编码的时空轨迹序列输送到Transformer模型中的基于结合多头注意力的全连接网络层进行训练,输出自注意力层的输出结果输送到前馈神经网络层中进行处理,得到包含输入轨迹数据的时空特征表示结果输送到解码器中,输出轨迹预测结果。本发明预测准确。
-
-
-
-
-
-
-
-
-