-
公开(公告)号:CN117275606A
公开(公告)日:2023-12-22
申请号:CN202311254921.6
申请日:2023-09-26
Applicant: 南京大学
IPC: G16C20/30 , G16C20/70 , G06F18/241 , G06F18/213
Abstract: 本发明公开了一种基于化合物2D结构的用途分类模型的构建方法与应用,属于化合物用途高通量预测领域。本发明通过CompTox Chemicals Dashboard数据库收集化合物结构和用途,将化合物结构用分子描述符和混合分子指纹表征,而后去冗余并输入随机森林回归模型进行特征选择、超参数搜索、模型训练和验证,通过化合物的结构实现有效预测化合物的用途,有效填补目前大量化学品仅有结构而用途未知的空白,为我国和全球化学品的管控提供有效辅助和导向。
-
公开(公告)号:CN116189762A
公开(公告)日:2023-05-30
申请号:CN202310189155.3
申请日:2023-02-28
Applicant: 南京大学
Abstract: 本发明公开了一种基于斑马鱼胚胎体系的内分泌简化转录组的构建方法与应用,属于内分泌干扰物高通量识别和筛查领域。本发明通过使用BORDA计数法整合了基因中心性、信息丰富度和冗余程度三个维度的证据得分,构建了特异性的内分泌干扰简化基因集,极大的减少了每个物质内分泌干扰筛查所需的测序深度,在降低测试成本的同时提高对内分泌干扰物的筛查通量,对我国和全球内分泌干扰相关新污染物的快速筛查、机制解析和有害结局的预测提供助力和支撑。
-
公开(公告)号:CN116052772A
公开(公告)日:2023-05-02
申请号:CN202310071460.2
申请日:2023-01-31
Applicant: 南京大学
Abstract: 本发明公开了一种干扰生物学通路的活性结构预测方法,通过构建包含细胞系、暴露时间、暴露浓度等明确标签的化合物生物学通路干扰数据库,通过累计超几何分布和累计伯努利分布评估训练集和测试集在生物学通路交叉程度和调控趋势的一致性,紧接着识别到训练集中一批潜在的化合物,进而以累积分布概率评估潜在化合物中分子描述符的出现频率,最终实现通过输入生物学通路预测驱动其变化的潜在活性结构。
-
-