-
公开(公告)号:CN119993275A
公开(公告)日:2025-05-13
申请号:CN202510056177.1
申请日:2025-01-14
Applicant: 贵州大学
IPC: G16B35/20 , G06F18/10 , G06F18/2415 , G06F18/214 , G06F18/2113
Abstract: 本发明提供了一种基于机器学习的真菌表型条形码筛选方法,该方法包括:根据已发表标本和新鲜标本获取真菌数据;将真菌数据中的表型特征进行拆分转换,得到单位特征;对单位特征进行数据预处理,得到预处理数据,并将预处理数据划分为测试集和训练集;通过测试集和监督学习算法选取分类器的最佳参数,并根据最佳参数筛选出最佳模型;基于最佳模型,对单位特征进行重要性分析得到重要性排序;根据重要性排序筛选出条形码特征。该方法通过基尼系数、排列重要性和加性解释值来分析每个类别对应的特征的重要性,提高了识别筛选的多样性和精准度。