-
公开(公告)号:CN115268869A
公开(公告)日:2022-11-01
申请号:CN202210885120.9
申请日:2022-07-26
Applicant: 东北大学
IPC: G06F8/30 , G06F40/284 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于图序列化的代码搜索系统及方法,涉及代码搜索技术领域。本发明系统及装置通过图序列转换器G2SC学习代码片段的控制依赖关系和数据依赖关系,获得富含代码片段图结构信息的程序依赖图序列,并且比图神经网络更适用于节点少的代码图结构;在特征提取过程中使用注意力机制将方法名特征向量、Token特征向量、以及G2SC提取的程序依赖图特征向量进行融合,使得代码的语义和结构信息能够充分表达,特征提取更完整,有效提升代码搜索的准确率;使用G2SC、双向长短时记忆网络将代码片段的程序依赖图的信息映射到较低维度的特征空间中,可节省深度学习中所消耗的大量算力。