-
公开(公告)号:CN114611592A
公开(公告)日:2022-06-10
申请号:CN202210208158.2
申请日:2022-03-03
Applicant: 重庆大学
Abstract: 本发明属于机器学习和数据挖掘技术领域,公开了一种半监督特征选择方法、系统、介质、设备及终端,通过使用NLS评估缺少标签的数据集的局部数据结构,使用MIC计算标签和特征的相关性,利用数据集中的少量标签信息;根据邻域和标签之间的冲突比率自适应地组合NLS和MIC,确定特征的NMScore,从而评估重要性。本发明通过将自然邻融入半监督拉普拉斯方法改进产生自然拉普拉斯方法,能够对数据的局部数据结构有着更高的灵敏度;使用MIC进行标签与特征的相关性评估,并创新性的使用冲突系数进行两者的加权结合,得到最终的NM得分,使用该得分进行特征重要性排序能够很好的评估特征重要性,整个方法拥有更高的性能和效率。
-
公开(公告)号:CN114818884A
公开(公告)日:2022-07-29
申请号:CN202210365573.9
申请日:2022-04-08
Applicant: 重庆大学
IPC: G06K9/62
Abstract: 本发明属于数据工程技术领域,公开了一种结合懒惰学习和急切学习的层次特征选择方法及系统,所述结合懒惰学习和急切学习构建层次特征选择方法结合懒惰学习和急切学习构建层次特征选择算法LE‑HFS;通过两类互补方式的融合改进层次特征选择;LE‑HFS在懒惰学习和急切学习过程中分别使用LazyR和信息增益作为相关性度量,从不同的相关性角度进行综合性特性选择。本发明结合懒惰学习和急切学习的层次特征选择方法,通过两类互补方式的融合来改进层次特征选择,可以从不同的相关性角度进行综合性特性选择,LE‑HFS可以更好地消除层次冗余,从而显著的提高层次特征选择的精确性和稳定性。
-