-
公开(公告)号:CN110401451A
公开(公告)日:2019-11-01
申请号:CN201910505421.2
申请日:2019-06-12
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种基于字符集变换的自动机空间压缩方法,步骤包括:将模式串集构建成自动机,并生成状态转移矩阵;读取状态转移矩阵的各个状态行,计算最佳变换参数、最小有效后继状态和最大有效后继状态;根据状态转移矩阵和最佳变换参数,记录数据结构,将状态行替换为变换后的有效状态行;读取目标文本的字符,根据字符当前状态,利用双射函数进行字符变换,得到变换后的字符,符合条件下得到后继状态,实现压缩。本发明还提供一种基于字符集变换的自动机空间压缩系统,包括规则编译器、变换参数生成器、状态行变换器、比较器、压缩自动机存储器、状态寄存器、字符集变换器及文本扫描器。
-
公开(公告)号:CN109783696A
公开(公告)日:2019-05-21
申请号:CN201811466997.4
申请日:2018-12-03
Applicant: 中国科学院信息工程研究所
IPC: G06F16/901 , G06F16/2458
Abstract: 本发明公开了一种面向弱结构相关性的多模式图索引构建方法及系统。本方法为:1)读取目标领域的模式图集合中的模式图并为每一模式图生成一模式图标志ID;2)构建模式图同构树:对各模式图进行两两判断,如果两个模式图之间存在子图同构关系,则添加一条从规模较小模式图指向规模较大模式图的有向边,得到模式图集合的模式图同构树;3)对模式图同构树进行频繁子图挖掘,找到公共模式图并将其加入到模式图同构树中;4)当模式图同构树中存在一子模式图具有多个父模式图时,则为该子模式图保留唯一的父模式图;5)计算模式图同构树的最小生成树,并对其进行深度优先遍历,得到模式图集的最优匹配顺序。本发明能够大大提高匹配效率。
-
公开(公告)号:CN108810020A
公开(公告)日:2018-11-13
申请号:CN201810776782.6
申请日:2018-07-13
Applicant: 中国科学院信息工程研究所 , 国家计算机网络与信息安全管理中心
CPC classification number: H04L63/306 , H04B7/18597 , H04L12/12 , H04L63/0236 , H04L63/0245 , H04W12/00 , H04W52/38
Abstract: 本发明提供一种空间互联网管控方法,其步骤包括:实时监测卫星空间站与卫星接收终端之间的星地信号以及卫星接收终端与用户终端之间的WiFi信号,找出卫星互联网用户;对检测到的卫星互联网用户的WiFi信号进行解调、协议解析及内容还原,根据管控策略判断是否含有非法内容;如果含有非法内容,通过噪声干扰来阻断区域范围内的星地信号,通过协议阻断来阻断WiFi信号。
-
公开(公告)号:CN107885797A
公开(公告)日:2018-04-06
申请号:CN201711023877.2
申请日:2017-10-27
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F17/30277
Abstract: 本发明针对多模式图匹配问题,提出一种基于结构相关性的多模式图匹配方法,能够解决冗余计算问题,基于模式图结构相关性,在增加少量额外空间的前提下,提高了图模式匹配的整体性能。本发明主要是通过利用模式图之间的结构相关性,建立模式图之间的结构继承关系,将原本相互独立的模式图表示为一个整体数据结构,该数据结构保留了所有模式图需要匹配的非重复部分。同时重新规划了模式图匹配的顺序,使得在数据图中进行匹配时,可以避免多次匹配模式图中结构重复的部分,从而大大提升了图模式匹配的时间性能,达到加速计算的目的。
-
公开(公告)号:CN107515897A
公开(公告)日:2017-12-26
申请号:CN201710589808.1
申请日:2017-07-19
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
CPC classification number: G06F16/90344
Abstract: 本发明涉及一种串匹配场景下数据集生成方法、设备和可读存储介质。该方法包括以下步骤:1)独立地生成模式串的每个字符,形成预设规模和预设长度的随机模式串集合;2)根据已生成的随机模式串集合,构造指定命中水平的文本数据集;3)输出生成的随机模式串集合和文本数据集。该设备包括通过总线连接的接收器、处理器、存储器和发送器,所述存储器用于存储串匹配场景下数据集生成指令。本发明能够生成预设规模预设长度的随机模式串集合,根据已生成的随机模式串集合可以构造指定命中水平的文本数据集,该随机模式串集合和文本数据集能够用于串匹配算法的功能测试和性能测试,对串匹配算法的进一步研究和性能提升有重要的作用。
-
公开(公告)号:CN117909438B
公开(公告)日:2025-05-09
申请号:CN202410024769.0
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F16/334 , G06F40/30 , G06N3/0455
Abstract: 本发明公开了一种文档的篇章级事件论元抽取方法、系统及介质,属于文本信息抽取领域,针对上下文一致性检索、模式一致性检索和自适应混合检索这三种检索方式,通过构建基于T5模型的检索增强生成模型,执行对应的检索增强策略,可以回忆起有助于演示模型应该如何解决任务的样例。其中,本发通过自适应混合检索增强范式来生成参考向量作为深度线索,能够提高模型的类比能力。
-
公开(公告)号:CN116170168B
公开(公告)日:2025-05-06
申请号:CN202210253611.1
申请日:2022-03-15
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511
Abstract: 本发明公开一种基于深度支持向量数据描述的DGA域名检测方法及系统,涉及网络安全领域,为解决解决已有工作检测未知DGA家族方法单一、检测率低的问题,本发明首先从真实DNS流量获取不可解析域名作为待检测域名,然后对不可解析域名提取特征向量,最后将特征向量输入至深度支持向量数据描述算法模型中,判别每个不可解析域名是否是DGA域名。
-
公开(公告)号:CN116628303B
公开(公告)日:2025-03-14
申请号:CN202310462355.1
申请日:2023-04-26
Applicant: 中国科学院信息工程研究所
IPC: G06F16/951 , G06F16/958 , G06F16/353 , G06F18/2415 , G06F40/186 , G06N3/0455 , G06N3/08
Abstract: 本发明公开了一种基于提示学习的半结构化网页属性值抽取方法和系统,涉及互联网领域,首先根据DOM树简化算法检索变量节点的DOM树视角提示,然后设计包含任务描述的任务模板获得模板视角提示信息,最后引入基于encoder‑decoder结构的预训练语言模型,并以“提示”为核心操作,全面分析领域数据特点和目标任务特点,设计两种视角的提示信息,通过模板填充融合双视角提示信息,通过提示学习的方式在语义层面和任务层面联合引导预训练语言模型进行任务学习,实现预训练语言模型和属性值抽取任务的有效结合,实现了领域标注数据稀缺场景下优越的模型性能。
-
公开(公告)号:CN118760772A
公开(公告)日:2024-10-11
申请号:CN202410736212.X
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种基于多视图蒸馏增强的实体链接方法。本方法包括:1)多视图实体表征:将每个实体原本篇章级的文本描述分成多个句子级的视图,对每一视图独立地经过语言模型进行编码,得到每一句子视图对应的向量表征;从中选择一个和提及最相关的视图的向量表征作为实体的向量表征,以避免与提及无关的信息被引入到实体表征中;2)多视图蒸馏增强:在引入了细粒度的视图表征后,通过交叉对齐和自对齐机制,分别在原始的实体层次以及细粒度的视图层次两个维度上对齐学生模型和教师模型间的相关性分数分布,从而促进教师模型到学生模型的细粒度知识蒸馏。本发明促进了实体链接系统的整体性能的提升。
-
公开(公告)号:CN118646570A
公开(公告)日:2024-09-13
申请号:CN202410715623.0
申请日:2024-06-04
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/214 , G06F18/2433 , G06N3/042 , G06N3/0895
Abstract: 本发明公开了一种基于元伪标签的半监督恶意域名检测方法及系统,属于网络安全领域。本发明从DNS流量中提取域名之间的关联关系并建立域名关联图,提取域名特征并作为域名关联图中节点的初始化向量;将由金标签节点和无标签节点输入到伪标签生成器,推测出无标签节点上的伪标签,得到伪标签节点;将金标签节点和伪标签节点输入到域名分类器中,预测出良性域名和恶意域名;通过对伪标签生成器和域名分类器进行循环迭代训练,优化域名分类器的内循环参数和伪标签生成器的外循环参数;利用训练好的域名分类器对网络DNS流量中的恶意域名进行检测。本发明能够检测出隐藏在孤立节点中的恶意域名。
-
-
-
-
-
-
-
-
-