有机污染物定量结构活性相关建模的变量筛选方法

    公开(公告)号:CN102682209B

    公开(公告)日:2014-11-05

    申请号:CN201210137589.0

    申请日:2012-05-03

    Abstract: 本发明公开了一种有机污染物定量结构活性相关建模的变量筛选方法。首先计算全部的单变量和不同双变量组合的线性模型,二者均保留一定数量的最优模型。然后从保留的双变量线性模型中依次取出一个模型,将其中的两个变量与余下的变量中每一个变量分别组成三变量模型;直到所有保留的双变量模型处理完成,然后比较这些三变量模型的优劣,保留一定数量的最优三变量模型。依此类推,计算到构成模型的变量数满足要求时,停止计算。其中模型的优劣以Leave-One-Out Cross Validation(LOOCV)或者Leave-Multiple-Out Cross Validation(LMOCV)计算的q2或者均方根差RMSEV为终止标准。本发明原理简单,易于理解,容易编程实现,方法快速有效,保障了变量筛选的合理性以及模型的稳定性和预测能力。

    有机污染物定量结构活性相关建模的变量筛选方法

    公开(公告)号:CN102682209A

    公开(公告)日:2012-09-19

    申请号:CN201210137589.0

    申请日:2012-05-03

    Abstract: 本发明公开了一种有机污染物定量结构活性相关建模的变量筛选方法。首先计算全部的单变量和不同双变量组合的线性模型,二者均保留一定数量的最优模型。然后从保留的双变量线性模型中依次取出一个模型,将其中的两个变量与余下的变量中每一个变量分别组成三变量模型;直到所有保留的双变量模型处理完成,然后比较这些三变量模型的优劣,保留一定数量的最优三变量模型。依此类推,计算到构成模型的变量数满足要求时,停止计算。其中模型的优劣以Leave-One-Out Cross Validation(LOOCV)或者Leave-Multiple-Out Cross Validation(LMOCV)计算的q2或者均方根差RMSEV为终止标准。本发明原理简单,易于理解,容易编程实现,方法快速有效,保障了变量筛选的合理性以及模型的稳定性和预测能力。

Patent Agency Ranking