-
公开(公告)号:CN118643149A
公开(公告)日:2024-09-13
申请号:CN202410764855.5
申请日:2024-06-14
Applicant: 杭州电子科技大学 , 杭州电子科技大学滨江研究院有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06F40/284 , G06F40/12 , G06F18/22 , G06F18/23213 , G06N3/0442 , G06N3/08
Abstract: 本发明公开了一种多源海量教育数据统一集成方法,包括如下步骤:步骤1、获取学习文档、服务说明文档和事项说明文档,并进行文档加载和分块;步骤2、分别将学习文档、服务说明文档和事项说明文档作为输入,获取文档中单词级别词向量;步骤3、通过注意力机制计算单词级别词向量与上下文词向量的相似性,并根据单词级别词向量以及相似性得到句子级别词向量;步骤4、通过注意力机制计算句子级别词向量与句子级别上下文词向量的相似性,并根据句子级别词向量以及相似性得到文档级别词向量;步骤5、根据文档级别词向量执行文本任务。该方法可以更准确地对文本进行分类,大幅度提升检索的正确性,以提升生成答案的正确率。
-
公开(公告)号:CN119248277A
公开(公告)日:2025-01-03
申请号:CN202411239097.1
申请日:2024-09-05
Applicant: 杭州电子科技大学 , 杭州电子科技大学滨江研究院有限公司
IPC: G06F8/41 , G06N3/0464 , G06N3/08 , G06N20/20
Abstract: 本发明提供了一种基于AST的代码度量和代码语义的代码异味检测方法及系统。本发明首先通过解析代码片段来构造流增强抽象语法树(Flow‑Augmented Abstract Syntax Tree,FA‑AST),并从中提取三类基于AST的代码度量:结构度量、句法度量和语义度量。然后,利用深度学习模型从源代码中捕捉代码的上下文信息和依赖关系,以提取代码语义。最后,通过融合基于AST的代码度量与代码语义,输入分类模型来进行训练和测试,以识别代码中的异味并对其严重程度进行评估。本发明提供的基于AST的代码度量相比于传统静态代码分析工具提取的软件代码度量更全面、且更易提取,在提高代码异味检测的精度和效率方面具有明显优势。
-