-
公开(公告)号:CN118969125A
公开(公告)日:2024-11-15
申请号:CN202411466899.6
申请日:2024-10-21
Applicant: 哈尔滨工业大学(威海)
IPC: G16C20/30 , G16C20/10 , G16C20/70 , G06F18/214 , G06F18/22 , G06F18/241 , G06F18/23 , G06N20/20
Abstract: 本发明涉及计算毒理学领域,公开了一种基于分子特征与机器学习的线粒体毒性预测方法,包括:获取对线粒体有毒或无毒的化合物数据;对采集数据集进行预处理;计算化合物的分子指纹和分子描述符,并耦合降维;将特征数据集分为训练集和测试集,构建基于树的机器学习模型和基于距离的机器学习模型,进行模型训练和基于权重集成不同类型模型;测试集数据带入模型进行预测,并评估选取最优的组合作为化合物线粒体毒性预测模型;计算线粒体毒性预测模型的应用域并对模型机理进行解释性分析。本发明可以预测小分子化合物是否具有线粒体毒性及毒性机理,相较于现有的QSAR预测方法,预测准确率和召回率更高,模型更为可靠。