-
公开(公告)号:CN115185732B
公开(公告)日:2025-05-02
申请号:CN202210849578.9
申请日:2022-07-19
Applicant: 南通大学
IPC: G06F11/07 , G06F8/75 , G06N3/0455 , G06N3/086 , G06N3/126
Abstract: 本发明提供了一种融合遗传算法和深度神经网络的软件缺陷预测方法,属于计算机技术领域,解决了自动缺陷预测中新的特征具有不确定性,会和预测结果有别的技术问题;其技术方案为:采用了结果优化的遗传算法选取数据集的特征,结合变分自编码器和最大均值差异距离,学习源项目和目标项目的共性特征,来训练可靠的缺陷预测模型。本发明的有益效果为:本发明的遗传算法结合贝叶斯算法替换传统遗传算法的随机变异过程,设计了新的适应度函数,减少了不必要的特征,通过多组数据集上与传统跨项目缺陷预测方法对比,表明本发明可以提高软件预测的有效性。
-
公开(公告)号:CN119868906A
公开(公告)日:2025-04-25
申请号:CN202411911227.1
申请日:2024-12-24
Applicant: 南通大学
Abstract: 本发明提供了一种提示最佳启动时间的羽毛球高远球辅助训练系统,属于体育训练设备技术领域。解决了羽毛球初学者难以捕捉高远球击球启动时机从而导致学习效率低下的技术问题。其技术方案为:系统由以下四个模块组成:M1:动作识别模块;M2:羽毛球跟踪模块;M3:时序计算模块;M4:反馈模块。本发明的有益效果为:本发明结合可穿戴传感器、摄像系统及智能数据分析技术,精确监测运动员的关键动作与羽毛球的下落轨迹,实时计算并提示最佳的蹬腿启动时机,从而帮助运动员实现挥拍与羽毛球下落的高度同步,提升击球的准确性和竞技表现。
-
公开(公告)号:CN114491293B
公开(公告)日:2024-12-20
申请号:CN202210104815.9
申请日:2022-01-28
Applicant: 南通大学
IPC: G06F16/9536 , G06Q50/00 , G06F18/25
Abstract: 本发明属于复杂网络分析技术领域,具体涉及一种统一化融合内容信息的半监督社团检测方法。本发明的步骤为:形式化带有节点内容网络中的拓扑和内容信息;利用基于非负矩阵分解的生成框架实现基于标准NMF和SNMF的拓扑子模型,计算结构相似度构建must‑link先验信息以调整节点社团隶属度,借鉴pLSA主题模型思想,基于非负矩阵分解构建内容子模型;引入平衡因子统一化融合具有先验信息的拓扑子模型和内容子模型,进而构建统一化融合节点内容半监督社团检测模型,最后,利用梯度下降法学习模型参数,得到节点的社团隶属度矩阵,进行聚类以挖掘网络中社团结构,运用标准化互信息熵NMI和调整兰德系数ARI对模型性能进行评估。
-
公开(公告)号:CN118312438A
公开(公告)日:2024-07-09
申请号:CN202410569009.8
申请日:2024-05-09
Applicant: 南通大学
Abstract: 本发明提供了一种基于代码结构知识微调的源代码漏洞检测方法,属于计算机技术领域,解决了深度神经网络模型在微调时不能充分的理解源代码的上下文和结构特征的技术问题。其技术方案为:包括以下步骤:S1:对数据集进行预处理和切分;S2:提取代码的抽象语法树;S3:将训练集中的代码片段输入到CodeT5模型中;S4:计算结构距离矩阵和注意力矩阵之间的sinkhorn距离,得到结构损失;S5:在微调阶段,使用多任务学习方法,联合结构损失和漏洞检测的目标函数来优化模型。S6:将测试集输入到已训练好的模型中进行二分类漏洞检测。本发明的有益效果为:提高源代码漏洞检测的准确性和可靠性。
-
公开(公告)号:CN115794218A
公开(公告)日:2023-03-14
申请号:CN202211585727.1
申请日:2022-12-09
Applicant: 南通大学
IPC: G06F8/73 , G06F40/166 , G06N3/0442
Abstract: 本发明提供了一种基于语义信息增强的Bash代码注释生成方法,属于计算机领域。解决了Bash注释生成任务中数据集较小和不能全部利用CodeBERT输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在语料库生成的嵌入层使用对抗训练,生成对抗样本以增强语义信息;S2:使用原语料库生成的词嵌入和对抗样本对CodeBERT进行微调,输出12层表征信息;S3:使用Bi‑LSTM+注意力机制聚合12层表征信息,生成融合信息;S4:使用解码器进行解码并输出Bash注释。本发明的有益效果为:本发明提出的模型可以捕获和利用更多的语义表征信息,从而提高注释生成的质量和可靠性。
-
公开(公告)号:CN113961821A
公开(公告)日:2022-01-21
申请号:CN202111220041.8
申请日:2021-10-20
Applicant: 南通大学
IPC: G06F16/9536 , G06F17/16 , G06K9/62
Abstract: 本发明公开了一种基于图正则融合异构拓扑和节点内容的社团检测方法,属于复杂网络分析技术领域,该方法识别具有内容信息的网络数据中社团结构,运用随机块框架的非负矩阵分解和图正则化分别建模拓扑和内容,基于“具有相似内容的节点很有可能属于同一社团”子空间聚类思想,以融合拓扑和内容,以构建基于图正则的非负矩阵分解社团检测模型;最后使用评价算法归一化互信息熵评估模型有效性。本发明的有益效果为:运用图正则融合拓扑和内容,同时,提出节点流行度和K近邻一致性分别处理拓扑和内容特性,提高了社团检测能力。
-
公开(公告)号:CN106844218B
公开(公告)日:2020-06-23
申请号:CN201710076573.6
申请日:2017-02-13
Applicant: 南通大学
IPC: G06F11/36
Abstract: 本发明提供一种基于演化切片的演化影响集预测方法,主要用于构建演化影响集以辅助软件开发者和维护者作出演化策略,包括如下步骤:识别演化元素;生成演化切片准则;构建演化数据依赖图;构建演化控制依赖图;生成演化切片作为演化影响集;度量演化影响集。本发明公开的基于演化切片的演化影响集预测(ESISP)方法具有较高的查全率和较低的存伪率,能有效辅助软件开发人员和维护人员作出相关决策。
-
公开(公告)号:CN116257253A
公开(公告)日:2023-06-13
申请号:CN202310167403.4
申请日:2023-02-27
Applicant: 南通大学
IPC: G06F8/41 , G06N3/0442 , G06N3/08
Abstract: 本发明提供了一种基于数据增强和语义感知的Bash代码注释自动生成方法,属于计算机领域。解决了Bash注释生成任务中低资源和不能有效利用BERT模型输出的所有特征信息的问题。其技术方案为:包括以下步骤:S1:在模型嵌入层使用NP‑GD,生成多组对抗例子;S2:利用原训练集和生成的对抗例子微调CodeBERT;S3:使用LSTM+Attention聚合步骤S2输出的多层表征信息;S4:使用Transformer解码器解码步骤S3输出的融合向量并输出Bash注释。本发明的有益效果为:该方法可以捕获更多的表征信息,提高Bash注释生成的质量。
-
公开(公告)号:CN116166563A
公开(公告)日:2023-05-26
申请号:CN202310211242.4
申请日:2023-03-07
Applicant: 南通大学
Abstract: 本发明提供了一种基于GraphSAGE和LDA的缺陷预测方法,属于计算机技术领域,解决了手工特征方法没有考虑代码项目的自然语言信息软件缺陷预测的问题。其技术方案为:包括以下步骤:(1)搜集来自Github的缺陷实例数据集,对该数据集进行预处理操作;(2)使用LDA提取项目的主题描述信息;(3)将代码片段解析为抽象语法树,并且提取token之间的关系矩阵;(4)通过BERT对token和主题词信息编码为特征向量,并对向量进行拼接;(5)将向量输入GraphSAGE训练,得到每个节点的特征表示;(6)将节点表示输入到mlp分类器中,进行缺陷预测。本发明的有益效果为:提高缺陷预测的可靠性和准确性。
-
公开(公告)号:CN115469925A
公开(公告)日:2022-12-13
申请号:CN202211198773.6
申请日:2022-09-29
Applicant: 南通大学
Abstract: 本发明提供了一种基于预训练模型和空间结构信息的代码注释生成方法,属于计算机领域。解决了注释生成模型中代码特征提取部分缺乏代码空间结构的问题。其技术方案为:包括以下步骤:S1:抽取Java部分并进行预处理;S2:使用CodeBERT提取代码语义特征,并进行关键特征提取和降维;S3:构建数据集的抽象语法树(ASTs);S4:构建GNN神经网络;S5:将步骤S2中提取的语义特征向量和步骤S3得到的ASTs信息输入GNN模型;S6:将步骤S2得到的语义特征信息和步骤S5得到的结构特征信息结合;S7:使用解码器进行解码并输出注释。本发明的有益效果为:本发明提高注释生成的质量和可靠性。
-
-
-
-
-
-
-
-
-