基于多级代码表示的特征依恋检测方法

    公开(公告)号:CN119025418A

    公开(公告)日:2024-11-26

    申请号:CN202411064135.4

    申请日:2024-08-05

    Abstract: 本发明公开了基于多级代码表示的特征依恋检测方法,基于java编程语言代码,包括以下步骤:将待处理的java编程语言代码转换为token序列即第一代码表示,同时将待处理的java编程语言代码转换为基于抽象语法树的异构有向超图即第二代码表示;将第一代码表示输入至双向长短期记忆网络模型得到第一输出特征,将第二代码表示输入至超图网络模型得到第二输出特征;将第一输出特征和第二输出特征进行融合得到总输出特征;对总输出特征进行代码特征依恋检测,得到检测结果。本发明通过这种结合多级源代码表示的方法,能够全面地获取代码的结构、语法和语义等高阶信息,从而为代码异味检测提供了更为丰富和深入的数据特征。

Patent Agency Ranking