-
公开(公告)号:CN116756654A
公开(公告)日:2023-09-15
申请号:CN202310822787.9
申请日:2023-07-06
Applicant: 南通大学
IPC: G06F18/2415 , G06F18/23213 , G06F18/214
Abstract: 本发明提供一种基于半监督学习的数字化信息归并分类算法,检测原始数字化信息中的概念漂移数据,滤除噪声数据,降低对后续分类结果精度的影响;利用半监督学习训练K均值聚类算法,利用训练后算法训练数据块,构建基础分类器,通过对目标函数求解获得最优聚类中心;构建基于SDClass算法的归并分类器,计算每个数据块类标签的估计值,以及估计值与簇中心间距离,找出最近的簇,将对应的数据块划分到该簇中,实现数字化信息的归并分类。选取6种不同类型的数据集对所提方法展开实验测试,结果表明,所提方法针对不同类型的数据集均可实现高精准分类,且具有较高的分类效率。
-
公开(公告)号:CN116226863A
公开(公告)日:2023-06-06
申请号:CN202310019625.1
申请日:2023-01-06
Applicant: 南通大学
IPC: G06F21/57 , G06F11/36 , G06N3/0464
Abstract: 本发明涉及网络通讯信息安全技术领域,具体涉及基于图神经网络的软件源码漏洞检测方法。本发明提取软件源码漏洞特征,针对漏洞特征进行词义分析。利用图神经网络,构建软件源码漏洞检测模型,对源码漏洞进行二次检测,去掉重读的源码,得到正确的代码。通过该检测模型的训练,每个漏洞特征节点将自身的特征信息传递给邻域节点,从而将漏洞特征进一步聚合并融合。再通过激活函数,将图神经网络中的漏洞节点信息进行变换,增强模型的检测能力。无论漏洞节点与邻域节点如何变化,最终的节点中心长度保持一致。在多级权重实时更新的条件下,聚合的信息特征也逐一采集到图节点中,由此获取的表征数据更加真实,最大限度地提高了源码漏洞检测效果。
-
公开(公告)号:CN115660734A
公开(公告)日:2023-01-31
申请号:CN202211385721.X
申请日:2022-11-07
Applicant: 南通大学
IPC: G06Q30/0202 , G06F18/214 , G06N20/20 , G06Q50/26
Abstract: 本发明涉及机票预测领域,尤其涉及一种基于集成学习的不平衡机票价格数据预测模型。解决了不平衡数据处理性能的问题。其技术方案为:包括以下步骤:S1:通过采集历史航班特征和价格序列;S2:对于价格,使用箱线法对异常值进行筛选删除,对于空值采用均值填充;S3:将节假日的价格数据作为少数类,正常时期的价格作为多数类;S4:构造成一个新的数据集D1D2;S5:重复步骤S5的过程m次,共生成m个新的数据集;S6:将步骤S5中模型M,采用以KNN,XGBoost,RF作为基学习器;S7:将步骤S5中的每个数据集作为输入。本发明的有益效果为:本发明可以得出更加稳定价格的预测结果。
-
-