-
公开(公告)号:CN104809161A
公开(公告)日:2015-07-29
申请号:CN201510152316.7
申请日:2015-04-01
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2-tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2-tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。
-
公开(公告)号:CN118760745A
公开(公告)日:2024-10-11
申请号:CN202410736214.9
申请日:2024-06-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种面向知识图谱复杂逻辑推理的生成式方法。本发明包括查询转换模块和扩散推理模块,逻辑查询转换模块将一阶逻辑查询转换为输入序列,扩散推理模块展示了前向和后向的双向生成过程,并设计了一个结构增强自注意力机制的变换器。查询转换模块将符号化的一阶逻辑查询转换为自然语言输入序列,扩散推理模块通过前向过程和后向过程的多步生成过程来捕捉复杂逻辑查询的复合分布;同时,在扩散模型的转换器中设计了一个结构增强的自注意力机制,以有效地融合知识图谱中重要的结构特征。本发明通过对扩散中间过程的多粒度控制进一步保证了模型的可控性和可解释性;相较于其他基线方法实现了更好的知识图谱推理结果。
-
公开(公告)号:CN118503775A
公开(公告)日:2024-08-16
申请号:CN202410499002.3
申请日:2024-04-24
Applicant: 中国科学院信息工程研究所
IPC: G06F18/241 , G06N3/042 , G06N3/082
Abstract: 本发明公开了基于属性图表示的用户网络节点或边的分类方法及系统,属于图数据处理领域,针对用户网络的属性信息构建属性图,计算所有邻居节点的属性信息和拓扑信息对目标节点的全局表示产生的影响;再将这两种影响与目标节点的全局表示进行融合,迭代得到目标节点最终的低维表示;输入到多层感知器中进行分类预测。本发明能够解决现有基于图神经网络的属性图表示学习方法中存在的属性扰动、过平滑问题以及属性、拓扑信息影响差异未被充分建模等问题,以及这些问题对最终分类预测造成的不良影响。
-
公开(公告)号:CN118194952A
公开(公告)日:2024-06-14
申请号:CN202410024764.8
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06N3/082 , G06N3/0495 , G06N3/045 , G06N3/047
Abstract: 本发明涉及一种基于助教的动态目标对齐的数据高效知识蒸馏方法和系统。该方法包括:在数据层,采用基于熵的策略选择信息丰富的样本,将其输入学生模型进行学习;在模型层,引入助教模型,根据训练过程中学生模型的能力的演变动态地查询教师模型或助教模型;在目标层,根据熵值从教师模型中选择信息丰富的层,使学生模型与选择的教师模型中信息丰富的层进行动态对齐;通过学生模型、教师模型和助教模型,使知识从教师模型向学生模型转移,并随着学生模型的能力的进化提高知识蒸馏性能。本发明能够从数据、模型和目标层面全面提升知识蒸馏效果。
-
公开(公告)号:CN111753144B
公开(公告)日:2023-10-17
申请号:CN202010412343.4
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/903
Abstract: 本发明提出一种基于Warshall方法加速epsilon闭包计算的方法及系统,针对传统闭包计算整体消耗时间长的缺陷,涉及计算机领域,为了优化闭包算法,利用Warshall方法,在NFA构造DFA的过程中对现有的方法进行了优化,加速了DFA的构造过程。
-
公开(公告)号:CN116468122A
公开(公告)日:2023-07-21
申请号:CN202310373927.9
申请日:2023-04-10
Applicant: 中国科学院信息工程研究所
Abstract: 本发明公开了一种融合图结构信息的知识图谱推理方法,其步骤包括:利用目标领域的三元组构建知识图谱并将其存储到知识图谱推理模型;所述知识图谱推理模型计算所述知识图谱中每条边的里奇曲率;所述知识图谱推理模型通过多层感知机对每条边的所述里奇曲率信息进行映射,得到对应边的曲率映射向量;所述知识图谱推理模型利用所述曲率映射向量更新所述知识图谱中的节点状态和边状态,得到更新后的知识图谱;将该目标领域不完整的三元组输入所述知识图谱推理模型,所述知识图谱推理模型利用更新后的知识图谱得到完整的三元组。本方法所得模型补全三元组时各项性能指标均十分优秀,有广泛的实际价值和应用场景。
-
公开(公告)号:CN114050912B
公开(公告)日:2023-04-07
申请号:CN202111158750.8
申请日:2021-09-30
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/24 , G06N3/08
Abstract: 本发明涉及一种基于深度强化学习的恶意域名检测方法和装置。该方法的步骤包括:获取待检测域名的真实DNS流量;查询并记录真实DNS流量中待检测域名的whois信息;根据待检测域名本身以及whois信息,对待检测域名进行特征提取,生成待检测域名的特征向量;将待检测域名的特征向量输入至深度强化学习模型中,判断待检测域名是否具有恶意行为。本发明使用基于深度强化学习的方法来解决真实DNS流量中良性与恶意样本数据不平衡的分类问题,能够快速有效地发现真实DNS流量中存在的低比例恶意样本,在低平衡率时依旧保持较好的效果。
-
公开(公告)号:CN113382039B
公开(公告)日:2023-01-13
申请号:CN202110494589.5
申请日:2021-05-07
Applicant: 中国科学院信息工程研究所(CN)
IPC: H04L67/51
Abstract: 本发明公开了一种基于5G移动网络流量分析的应用识别方法和系统。本方法为:1)数据采集模块采集5G移动网络流量并将其发送给DPI识别模块;2)DPI识别模块对数据链路层和网络层进行拆包,获取五元组以及时间戳信息,然后根据五元组以及时间戳信息对数据包进行分类合并成流;然后根据每一流中数据包的明文特征判断该流对应的应用层协议;3)DFI识别模块从网络流量数据包中提取流量的多粒度级别特征,包括流特征、数据包特征、主机行为特征、TCP头部特征、IP头部特征;然后对得到的多粒度级别特征进行过滤;4)DFI识别模块根据过滤后的流的特征利用基于结构数据依赖的DBSCAN方法识别该流所属应用。
-
公开(公告)号:CN115439564A
公开(公告)日:2022-12-06
申请号:CN202210926540.7
申请日:2022-08-03
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于稠密子图的图压缩方法和系统,属于计算机软件技术领域。本发明利用稠密子图进行结点重排序并重编码,使得排序不用在大图上进行从而减少结点排序的时间,并降低稠密子图中各结点在内存中的冗余消耗;对抽取出的K边联通子图内各结点进行重编码,构建新的边的存储表示,使得图中出现频次较高的结点占用的空间得以减少;对于图的稀疏空间上,采用压缩邻接表降低存储消耗并采用二级索引提高结点邻居的查找效率。本发明简单且易于使用,降低了结点间的间隙距离,有效减少了将图存储在内存中所需的空间。
-
公开(公告)号:CN110688479B
公开(公告)日:2022-06-17
申请号:CN201910764862.4
申请日:2019-08-19
Applicant: 中国科学院信息工程研究所
IPC: G06F16/34 , G06F16/33 , G06F16/35 , G06F40/295
Abstract: 本发明公开了一种用于生成式摘要的评估方法及排序网络。本发明从三个方面来评估摘要质量:第一,运用语言模型来评估语言的流畅度;第二,使用相似度模型评估文本和摘要之间的语义相关性;第三,为了有效评估实体、专有词的复现程度,引入原文信息量模型来评估。本发明从摘要的语言流畅性、摘要与原文的相关性以及摘要所包含的信息量等多个方面来综合评估摘要的质量,大大提高了评估的准确性。
-
-
-
-
-
-
-
-
-