污染物定量结构活性相关模型结构描述符筛选终止的方法

    公开(公告)号:CN102156791B

    公开(公告)日:2012-10-17

    申请号:CN201110110058.8

    申请日:2011-04-29

    Applicant: 南京大学

    Abstract: 本发明公开了污染物定量结构活性相关模型结构描述符筛选终止的方法。本发明将交叉验证相关系数q2和模型修正相关系数R2adj进行整合;对某一变量子集建立统计模型,获得观测值与模型估计值之间的相关系数r2、修正相关系数R2adj;对上述过程中的变量子集进行交叉验证,获得模型的交叉验证相关系数q2,所用的交叉验证方法有两种:留一法交互验证和留多法交互验证;根据上述过程得到的统计参数构造新参数QRadj;对同一系统新参数QRadj的数值越大,说明模型的稳定性越高,预测能力越强。本发明中的新标准QRadj不仅能够保证所获模型具有较高的交叉验证相关系数q2,而且可以避免过拟合现象的出现,杜绝筛选出低r2值高q2值的QSAR模型变量组合,科学描述模型的稳定性和预测能力。

    有机污染物定量结构活性相关模型抽多法交叉验证方法

    公开(公告)号:CN102184284A

    公开(公告)日:2011-09-14

    申请号:CN201110112111.8

    申请日:2011-04-29

    Applicant: 南京大学

    Abstract: 本发明公开了一种有机污染物定量结构活性相关模型抽多法交互验证方法。本发明将均匀设计方法与留多法交互验证进行整合,以均匀设计优化的留多法交互验证(Uniform Design Optimized LMOCV,UDOLMOCV)的相关系数为变量筛选终止标准;同时在模型内部验证时,运用均匀设计优化的留多法交互验证对模型进行样本内部交叉验证,以为预测能力判断指标,提供更大的样本波动性,少量的样本抽样验证次数即可实现验证样本均匀分布样本空间,且每次抽取的样本具有很强的代表性。本发明所得验证样本具有很强的样本分布代表性,克服了Monte Carlo方法选取样本的单一方式。本发明可以不仅可以用于验证QSAR模型的稳定性和与预测能力,并且可以用于发现和确定模型中不稳定因素。

    污染物定量结构活性相关模型结构描述符筛选终止的方法

    公开(公告)号:CN102156791A

    公开(公告)日:2011-08-17

    申请号:CN201110110058.8

    申请日:2011-04-29

    Applicant: 南京大学

    Abstract: 本发明公开了污染物定量结构活性相关模型结构描述符筛选终止的方法。本发明将交叉验证相关系数q2和模型修正相关系数R2adj进行整合;对某一变量子集建立统计模型,获得观测值与模型估计值之间的相关系数r2、修正相关系数R2adj;对上述过程中的变量子集进行交叉验证,获得模型的交叉验证相关系数q2,所用的交叉验证方法有两种:留一法交互验证和留多法交互验证;根据上述过程得到的统计参数构造新参数QRadj;对同一系统新参数QRadj的数值越大,说明模型的稳定性越高,预测能力越强。本发明中的新标准QRadj不仅能够保证所获模型具有较高的交叉验证相关系数q2,而且可以避免过拟合现象的出现,杜绝筛选出低r2值高q2值的QSAR模型变量组合,科学描述模型的稳定性和预测能力。

Patent Agency Ranking