-
公开(公告)号:CN119248277A
公开(公告)日:2025-01-03
申请号:CN202411239097.1
申请日:2024-09-05
Applicant: 杭州电子科技大学 , 杭州电子科技大学滨江研究院有限公司
IPC: G06F8/41 , G06N3/0464 , G06N3/08 , G06N20/20
Abstract: 本发明提供了一种基于AST的代码度量和代码语义的代码异味检测方法及系统。本发明首先通过解析代码片段来构造流增强抽象语法树(Flow‑Augmented Abstract Syntax Tree,FA‑AST),并从中提取三类基于AST的代码度量:结构度量、句法度量和语义度量。然后,利用深度学习模型从源代码中捕捉代码的上下文信息和依赖关系,以提取代码语义。最后,通过融合基于AST的代码度量与代码语义,输入分类模型来进行训练和测试,以识别代码中的异味并对其严重程度进行评估。本发明提供的基于AST的代码度量相比于传统静态代码分析工具提取的软件代码度量更全面、且更易提取,在提高代码异味检测的精度和效率方面具有明显优势。
-
公开(公告)号:CN114330314B
公开(公告)日:2025-05-02
申请号:CN202111593675.8
申请日:2021-12-22
Applicant: 杭州电子科技大学
IPC: G06F40/258 , G06F40/289 , G06F16/35 , G06F18/2413 , G06F18/22
Abstract: 本发明涉及一种基于多示例学习的工业互联网专利识别方法,利用自然语言处理技术,将专利中的摘要信息切分成句子,并利用基于句子关系图的文本主题句抽取算法来抽取摘要中的主题句,可以有效减少计算开销。同时通过结合标题和摘要中抽取的主题句,将专利转换为为句子包,其中每个专利看作包,包中的每个句子看作示例。最后,通过采用K近邻算法(K Nearest Neighbors,KNN)来预测新样本的类别。通过本发明方法能有效提高工业互联网专利识别效果,极大地减少人工审查代价,对专利检索有着非常重要的意义。
-
公开(公告)号:CN115952076A
公开(公告)日:2023-04-11
申请号:CN202211529670.3
申请日:2022-11-30
Applicant: 杭州电子科技大学
IPC: G06F11/36 , G06F18/241 , G06N3/0464 , G06N3/048 , G06N3/08
Abstract: 基于代码语义和度量的代码异味识别方法,包括以下步骤:构建代码异味数据集;对代码片段进行数据预处理,得到代码语义表征信息和代码度量信息;将所述代码语义表征信息输入代码语义表征学习模型,得到代码语义嵌入;将所述代码度量信息输入代码度量关系学习模型,得到代码度量关系嵌入;将所述代码语义嵌入和代码度量关系嵌入进行融合,得到融合学习模型;构造所述融合学习模型的损失函数,对所述融合学习模型进行训练,得到代码异味识别模型;将待检测的代码片输入所述代码异味识别模型,得到代码异味识别结果。本发明设计的方法可以自动化识别多种代码异味,适用于不同语言和代码粒度。
-
公开(公告)号:CN116225526A
公开(公告)日:2023-06-06
申请号:CN202211605460.8
申请日:2022-12-14
Applicant: 杭州滨电信息技术有限公司 , 杭州电子科技大学
IPC: G06F8/75 , G06N3/045 , G06N3/042 , G06N3/0442 , G06N3/08
Abstract: 本发明提供一种基于图表示学习的代码克隆检测方法。本发明针对代码语义克隆,即Type‑IV克隆,设计了一种基于图的代码克隆检测模型,该模型结合了图注意力网络GAT和边收缩池化EdgePool,同时,本发明构造出一种并行节点内部注意力机制PNIAT,将源代码中解析出的控制流图CFG或程序依赖图PDG转换为标准的图神经网络GNN输入数据,然后将其输入由图注意力网络GAT和边收缩池化EdgePool构建的图神经网络中,输出对应的图嵌入表示,最后采用基于双向长短期记忆网络BiLSTM构建的解码器将成对的图嵌入表示并行解码,得到代码克隆检测的批量检测结果。
-
公开(公告)号:CN114330314A
公开(公告)日:2022-04-12
申请号:CN202111593675.8
申请日:2021-12-22
Applicant: 杭州电子科技大学
IPC: G06F40/258 , G06F40/289 , G06K9/62
Abstract: 本发明涉及一种基于多示例学习的工业互联网专利识别方法,利用自然语言处理技术,将专利中的摘要信息切分成句子,并利用基于句子关系图的文本主题句抽取算法来抽取摘要中的主题句,可以有效减少计算开销。同时通过结合标题和摘要中抽取的主题句,将专利转换为为句子包,其中每个专利看作包,包中的每个句子看作示例。最后,通过采用K近邻算法(K Nearest Neighbors,KNN)来预测新样本的类别。通过本发明方法能有效提高工业互联网专利识别效果,极大地减少人工审查代价,对专利检索有着非常重要的意义。
-
-
-
-