-
公开(公告)号:CN116484839A
公开(公告)日:2023-07-25
申请号:CN202310312448.6
申请日:2023-03-28
Applicant: 中国科学院信息工程研究所
IPC: G06F40/216 , G06F40/284 , G06F40/30 , G06N3/045 , G06N3/08
Abstract: 本发明公开一种基于协同元学习的推理加速方法及装置。所述方法包括:构建推理模型;其中,所述推理模型是每一transformer层之后额外添加一个早退分类器的基于transformer的模型;训练推理模型;其中,所述训练推理模型包括:优化推理模型的初始参数、和将优化参数传入Adam优化器进行梯度更新,以训练早退分类器;使用训练后的推理模型进行任务预测,并基于熵的退出机制输出所述任务的预测结果。本发明可以在保持很小的性能损失的同时提升模型的推理速度。
-
公开(公告)号:CN115587223A
公开(公告)日:2023-01-10
申请号:CN202211065691.4
申请日:2022-09-01
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903 , G06F16/35 , G06F16/33 , G06F40/216
Abstract: 本发明提出一种面向相似文本的正则表达式自动生成方法、系统及介质,涉及自然语言处理领域和信息安全领域,对于输入的相似文本,采用文本嵌入表示方法获得相似文本的嵌入表示;再将同类的相似文本聚为同一类别;对于每类相似文本,抽取出其中的公共部分和差异部分;将抽取的公共部分和差异部分进行组合,生成每类相似文本对应的正则表达式。本发明可高效快速地批量处理大量相似文本,不需人工参与,生成每类相似文本的正则表达式。
-
公开(公告)号:CN115442075A
公开(公告)日:2022-12-06
申请号:CN202210921613.3
申请日:2022-08-02
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于异质图传播网络的恶意域名检测方法和系统。该方法使用异质图传播网络进行恶意域名分类问题时,将DNS场景建模为包含主机、域名、IP地址的异质信息网络,该异质信息网络包含三种关系,能够很好的模拟真实DNS场景。该方法使用的异质图传播网络模型包含语义传播机制和语义融合机制。语义传播机制能够在聚合邻居节点特征时强调节点自身特征,即使增加语义传播机制的层数,学习到的节点特征依然可以相互区分,缓解语义混淆现象。语义融合机制能够在恶意域名检测任务下,学习到每个语义的重要性,加权融合各个语义。本发明能够有效地实现恶意域名检测。
-
公开(公告)号:CN113472742A
公开(公告)日:2021-10-01
申请号:CN202110588732.7
申请日:2021-05-28
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。
-
公开(公告)号:CN118194952A
公开(公告)日:2024-06-14
申请号:CN202410024764.8
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06N3/082 , G06N3/0495 , G06N3/045 , G06N3/047
Abstract: 本发明涉及一种基于助教的动态目标对齐的数据高效知识蒸馏方法和系统。该方法包括:在数据层,采用基于熵的策略选择信息丰富的样本,将其输入学生模型进行学习;在模型层,引入助教模型,根据训练过程中学生模型的能力的演变动态地查询教师模型或助教模型;在目标层,根据熵值从教师模型中选择信息丰富的层,使学生模型与选择的教师模型中信息丰富的层进行动态对齐;通过学生模型、教师模型和助教模型,使知识从教师模型向学生模型转移,并随着学生模型的能力的进化提高知识蒸馏性能。本发明能够从数据、模型和目标层面全面提升知识蒸馏效果。
-
公开(公告)号:CN116468122A
公开(公告)日:2023-07-21
申请号:CN202310373927.9
申请日:2023-04-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种融合图结构信息的知识图谱推理方法,其步骤包括:利用目标领域的三元组构建知识图谱并将其存储到知识图谱推理模型;所述知识图谱推理模型计算所述知识图谱中每条边的里奇曲率;所述知识图谱推理模型通过多层感知机对每条边的所述里奇曲率信息进行映射,得到对应边的曲率映射向量;所述知识图谱推理模型利用所述曲率映射向量更新所述知识图谱中的节点状态和边状态,得到更新后的知识图谱;将该目标领域不完整的三元组输入所述知识图谱推理模型,所述知识图谱推理模型利用更新后的知识图谱得到完整的三元组。本方法所得模型补全三元组时各项性能指标均十分优秀,有广泛的实际价值和应用场景。
-
公开(公告)号:CN114050912B
公开(公告)日:2023-04-07
申请号:CN202111158750.8
申请日:2021-09-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/24 , G06N3/08
Abstract: 本发明涉及一种基于深度强化学习的恶意域名检测方法和装置。该方法的步骤包括:获取待检测域名的真实DNS流量;查询并记录真实DNS流量中待检测域名的whois信息;根据待检测域名本身以及whois信息,对待检测域名进行特征提取,生成待检测域名的特征向量;将待检测域名的特征向量输入至深度强化学习模型中,判断待检测域名是否具有恶意行为。本发明使用基于深度强化学习的方法来解决真实DNS流量中良性与恶意样本数据不平衡的分类问题,能够快速有效地发现真实DNS流量中存在的低比例恶意样本,在低平衡率时依旧保持较好的效果。
-
公开(公告)号:CN115439564A
公开(公告)日:2022-12-06
申请号:CN202210926540.7
申请日:2022-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于稠密子图的图压缩方法和系统,属于计算机软件技术领域。本发明利用稠密子图进行结点重排序并重编码,使得排序不用在大图上进行从而减少结点排序的时间,并降低稠密子图中各结点在内存中的冗余消耗;对抽取出的K边联通子图内各结点进行重编码,构建新的边的存储表示,使得图中出现频次较高的结点占用的空间得以减少;对于图的稀疏空间上,采用压缩邻接表降低存储消耗并采用二级索引提高结点邻居的查找效率。本发明简单且易于使用,降低了结点间的间隙距离,有效减少了将图存储在内存中所需的空间。
-
公开(公告)号:CN107515897A
公开(公告)日:2017-12-26
申请号:CN201710589808.1
申请日:2017-07-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/90344
Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。
-
公开(公告)号:CN117149795A
公开(公告)日:2023-12-01
申请号:CN202311197360.0
申请日:2023-09-15
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于混合内存的自适应图计算更新方法及系统。本发明首先将有向图数据以出边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的出边数据块;以入边方式进行存储时,按照顶点区间均匀划分得到顶点区间及其对应的入边数据块;构建子图时,直接利用对应入边数据块、出边数据块,从而避免遍历所有数据块;为提高子图数据的访问效率,本发明将图数据的入边数据、出边数据分别存储在两个NUMA节点中;其次,采用一种基于数据驱动的推‑拉自适应的数据更新策略,以优化迭代图计算过程中消息更新的流程。本发明解决了混合内存图计算模型存在的子图构建和更新模式问题,大大提升了图计算的效率。
-
-
-
-
-
-
-
-
-