-
公开(公告)号:CN118260671A
公开(公告)日:2024-06-28
申请号:CN202410434032.6
申请日:2024-04-11
Applicant: 中南大学
IPC: G06F18/2415 , G06F18/213 , G06F17/16 , G06F18/214 , G06N3/08
Abstract: 本发明公开了一种面向亿级规模属性网络的节点分类方法,包括获取现有的大规模属性网络数据及对应的数据信息并建模构建闭邻域邻接矩阵和属性矩阵;构建稀疏随机矩阵并对属性矩阵投影得到初始嵌入矩阵;将初始嵌入矩阵与闭邻域邻接矩阵迭代相乘得到网络嵌入矩阵;1位量化网络嵌入矩阵得到量化网络嵌入矩阵;对量化网络嵌入矩阵进行逻辑非操作和拼接操作得到扩展嵌入矩阵;将扩展嵌入矩阵作为训练数据集训练模型得到节点分类模型;采用节点分类模型对待分类的大规模属性网络进行节点分类。本发明还公开了一种包括了所述面向亿级规模属性网络的节点分类方法的用户分类方法。本发明能够完成亿级规模属性网络的节点分类,资源占用少,分类效率高。
-
公开(公告)号:CN116432125B
公开(公告)日:2023-09-05
申请号:CN202310637656.3
申请日:2023-06-01
Applicant: 中南大学
IPC: G06F18/243 , G06F18/2411 , G06F18/22 , G06F8/41 , G06F17/16
Abstract: 本发明公开了一种基于哈希算法的代码分类方法,包括获取已有的代码数据和对应的分类结果提取对应的抽象语法树;计算得到各个抽象语法树的表达;基于抽象语法树之间的相似度构建核矩阵;构建抽象语法树分类初步模型并训练得到抽象语法树分类模型;采用抽象语法树分类模型进行实际的代码的分类。本发明避免了神经网络中复杂的数学计算和海量的参数学习,同时不再依赖昂贵的高端硬件,能够在满足代码分类精度的前提下,明显降低时间开销,尤其适用于大规模代码数据集场景下的代码分类任务,而且本发明的可靠性高、准确性好且效率较高。
-
公开(公告)号:CN116432125A
公开(公告)日:2023-07-14
申请号:CN202310637656.3
申请日:2023-06-01
Applicant: 中南大学
IPC: G06F18/243 , G06F18/2411 , G06F18/22 , G06F8/41 , G06F17/16
Abstract: 本发明公开了一种基于哈希算法的代码分类方法,包括获取已有的代码数据和对应的分类结果提取对应的抽象语法树;计算得到各个抽象语法树的表达;基于抽象语法树之间的相似度构建核矩阵;构建抽象语法树分类初步模型并训练得到抽象语法树分类模型;采用抽象语法树分类模型进行实际的代码的分类。本发明避免了神经网络中复杂的数学计算和海量的参数学习,同时不再依赖昂贵的高端硬件,能够在满足代码分类精度的前提下,明显降低时间开销,尤其适用于大规模代码数据集场景下的代码分类任务,而且本发明的可靠性高、准确性好且效率较高。
-
-