-
公开(公告)号:CN114492651A
公开(公告)日:2022-05-13
申请号:CN202210113155.0
申请日:2022-01-30
Applicant: 西北农林科技大学
Abstract: 本发明公开了一种基于个性化网页排位的半监督图节点分类方法:步骤1:对于给定的图,通过个性化网页排位算法计算得到图中节点的个性化网页排位值,从而得到各个标签对应的排序分布向量,根据排序分布向量得到节点的依赖向量,对依赖向量进行正则化后得到依赖关系矩阵。步骤2、通过对图神经网络的隐藏层进行多层堆叠计算,得到图神经网络经过多层隐藏层堆叠后输出的隐藏层矩阵;步骤3、将依赖关系矩阵加入到图神经网络的最后一层隐藏层矩阵中得到新的全局隐藏矩阵,进而得到新的图神经网络;步骤4、使用新的图神经网络进行节点分类。本发明最终使用新构建的图神经网络进行节点分类,达到了更好的节点分类效果。
-
公开(公告)号:CN114528926B
公开(公告)日:2025-01-17
申请号:CN202210113153.1
申请日:2022-01-30
Applicant: 西北农林科技大学
IPC: G06F18/214 , G06F18/2415 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种基于图神经网络的种子集扩展方法及系统,该方法具体包括如下步骤:步骤1,对于给定的图数据,获取图结构信息、节点属性,给定伪标签、种子集以及需要扩展节点个数K,通过EM算法训练两个图神经网络,计算得到伪标签的注意力系数和节点特征的注意力系数;步骤2、根据伪标签的注意力系数和节点特征的注意力系数计算得到概率矩阵A;步骤3、根据需要扩展节点个数K,利用概率矩阵A中的概率系数引导PageRank进行游走,获取扩展到的节点。本发明结合了标签和节点属性信息,并应用在种子集扩展过程中,经试验,扩展得到的节点集相比传统的种子集扩展算法,扩展得到的节点中有更多的节点属于种子集所在社区。
-
公开(公告)号:CN114492651B
公开(公告)日:2025-01-17
申请号:CN202210113155.0
申请日:2022-01-30
Applicant: 西北农林科技大学
IPC: G06V10/764 , G06V10/774 , G06N3/0464 , G06N3/0895 , G06N3/042 , G06V10/82
Abstract: 本发明公开了一种基于个性化网页排位的半监督图节点分类方法:步骤1:对于给定的图,通过个性化网页排位算法计算得到图中节点的个性化网页排位值,从而得到各个标签对应的排序分布向量,根据排序分布向量得到节点的依赖向量,对依赖向量进行正则化后得到依赖关系矩阵。步骤2、通过对图神经网络的隐藏层进行多层堆叠计算,得到图神经网络经过多层隐藏层堆叠后输出的隐藏层矩阵;步骤3、将依赖关系矩阵加入到图神经网络的最后一层隐藏层矩阵中得到新的全局隐藏矩阵,进而得到新的图神经网络;步骤4、使用新的图神经网络进行节点分类。本发明最终使用新构建的图神经网络进行节点分类,达到了更好的节点分类效果。
-
公开(公告)号:CN114528926A
公开(公告)日:2022-05-24
申请号:CN202210113153.1
申请日:2022-01-30
Applicant: 西北农林科技大学
Abstract: 本发明公开了一种基于图神经网络的种子集扩展方法及系统,该方法具体包括如下步骤:步骤1,对于给定的图数据,获取图结构信息、节点属性,给定伪标签、种子集以及需要扩展节点个数K,通过EM算法训练两个图神经网络,计算得到伪标签的注意力系数和节点特征的注意力系数;步骤2、根据伪标签的注意力系数和节点特征的注意力系数计算得到概率矩阵A;步骤3、根据需要扩展节点个数K,利用概率矩阵A中的概率系数引导PageRank进行游走,获取扩展到的节点。本发明结合了标签和节点属性信息,并应用在种子集扩展过程中,经试验,扩展得到的节点集相比传统的种子集扩展算法,扩展得到的节点中有更多的节点属于种子集所在社区。
-
公开(公告)号:CN111291108A
公开(公告)日:2020-06-16
申请号:CN202010049533.4
申请日:2020-01-16
Applicant: 西北农林科技大学
IPC: G06F16/26 , G06F16/2455
Abstract: 本发明公开了一种基于分位概要获取不确定数据集全局概率分布方法及装置,该方法以生成分位概要为基础,采用频率分布直方图描述不确定数据流的全局概率分布;首先初始化存放分位概要数据序列的存储空间,持续读入每个不确定数据,为之生成概要数据,插入到序列中;合并部分可合并的概要数据,减少内存开销;最后利用分位概要数据构造频率分布直方图。该方法采用增量式处理,对数据集仅作一遍扫描,可处理大规模静态数据集或数据流;可处理连续型不确定数据;可指定所获取概率分布的误差范围。在不确定数据管理的查询分析、查询计划与优化和数据挖掘等领域都有着广泛的应用前景。
-
-
-
-