-
公开(公告)号:CN117520843A
公开(公告)日:2024-02-06
申请号:CN202311479210.9
申请日:2023-11-08
Applicant: 中国林业科学研究院资源信息研究所
IPC: G06F18/214 , G06F18/2135 , G06F18/243 , G06F18/27
Abstract: 本发明公开了一种稳健的模型变量筛选方法,变量筛选可用于从给定的多输入变量数据集中过滤掉与因变量冗余或不相关的自变量,从而产生更具代表性的变量组合,并获得更好的模型预测性能,以“投票法”为原则,采用多种统计学和机器学习方法,同时考虑自变量对因变量的线性和非线性作用,获得对因变量具有显著影响的特征变量,解决了现有模型特征筛选方法的结果不够稳定的问题,尤其是在自变量个数较多的高维空间内,本发明得到的变量筛选结果在提高了模型准确度的同时,也能有效降低模型不确定性,是一种通用且稳健的变量筛选方法,能为生物数学领域中因变量影响因子分析和模型研建提供分析方法和工具。