-
公开(公告)号:CN116992258A
公开(公告)日:2023-11-03
申请号:CN202310974597.9
申请日:2023-08-02
Applicant: 湖北工业大学
IPC: G06F18/2111 , G06F18/2113 , G06F18/214 , G06F16/35 , G06F40/216 , G06F40/284 , G06N3/06
Abstract: 本发明公开了一种基于改进蚁群优化算法的多标签文本特征选择方法,包括以下步骤:步骤1、数据准备,对文本数据集进行预处理;步骤2、环境准备,转换得到的文本向量和标签向量使用岭回归提取特征标签相关性;步骤3、蚁群优化;步骤4、特征选择并输出迭代后的信息素。本发明通过蚁群在有监督和无监督加权图中游走,寻找在这两个监督范式下冗余性都较低的特征,同时通过节点中心性自适应的调整蚁群在不同数据集上迭代过程中所需游走的特征个数,通过参数的自适应提高蚁群的搜索能力,平衡探索与开发的能力。通过以上两个策略提升蚁群的优化能力,使得蚁群能捕获具有判别力的特征,获得最优特征子集。