一种药物-蛋白质相互作用预测方法及系统

    公开(公告)号:CN115458061B

    公开(公告)日:2024-01-23

    申请号:CN202211258086.9

    申请日:2022-10-13

    Applicant: 南开大学

    Abstract: 本申请公开了一种药物‑蛋白质相互作用预测方法及系统,其中,方法包括:收集药物‑蛋白质相互作用预测的数据集;对数据集进行预处理,得到处理后数据;基于处理后数据,进行蛋白质序列编码,提取蛋白质特征;基于蛋白特征,同时对药物和蛋白质的分子机制进行编码,得到第一编码结果;基于处理后数据,将药物和蛋白质的临床信息编码在一起,得到第二编码结果;根据第一编码结果和第二编码结果,计算药物‑蛋白质对的相互作用概率。本申请同时考虑了药物和蛋白质的化学属性、分子机制和临床功能;将药物和蛋白质的原始特征投影到了共同的嵌入子空间中;通过分析药物和蛋白质的特征的一致

    基于深度学习的新抗原序列生成方法及系统

    公开(公告)号:CN116403639A

    公开(公告)日:2023-07-07

    申请号:CN202310331805.3

    申请日:2023-03-30

    Applicant: 南开大学

    Abstract: 本发明公开了一种基于深度学习的新抗原序列生成方法及系统,该方法包括:获取原始新抗原数据;对原始新抗原数据进行预处理,获取原始新抗原序列及其对应的HLA序列;根据原始新抗原序列及其对应的HLA序列,对原始新抗原序列进行突变,并对原始新抗原序列在序列空间中进行蒙特卡洛搜索,确定符合设计目标的突变后的新抗原序列;通过分子对接、递呈能力预测和免疫能力预测进行突变后的新抗原序列的筛选,获取最终的新抗原序列。本发明基于深度学习的方法生成全新的新抗原,并对生成的新抗原序列进行筛选,使得最终获取的新抗原具有更优的亲和力和免疫能力。

    一种肿瘤微环境中解耦耗竭性T细胞的系统

    公开(公告)号:CN116364188A

    公开(公告)日:2023-06-30

    申请号:CN202310330384.2

    申请日:2023-03-30

    Applicant: 南开大学

    Inventor: 刘健 阮志涵 陈娇

    Abstract: 本发明涉及生物信息学技术领域,公开了一种肿瘤微环境中解耦耗竭性T细胞的系统,包括:对单细胞数据和空间转录组数据分别进行预处理;通过对预处理后的单细胞数据进行两次聚类分群和标记基因的计算,提取出肿瘤浸润性T细胞数据、耗竭性T细胞数据;对预处理后的肿瘤组织空间转录组数据进行聚类分群,得到若干个空间域;利用解卷积方法,在若干个空间域中识别出肿瘤浸润性T细胞的空间域,并在肿瘤浸润性T细胞的空间域中识别出耗竭性T细胞的空间域,并得到耗竭性T细胞在肿瘤浸润性T细胞中所占的比例。能够定位耗竭性T细胞在肿瘤微环境中的空间定位,从而进一步分析在不同肿瘤微环境下的结构与功能。

    一种药物-蛋白质相互作用预测方法及系统

    公开(公告)号:CN115458061A

    公开(公告)日:2022-12-09

    申请号:CN202211258086.9

    申请日:2022-10-13

    Applicant: 南开大学

    Abstract: 本申请公开了一种药物‑蛋白质相互作用预测方法及系统,其中,方法包括:收集药物‑蛋白质相互作用预测的数据集;对数据集进行预处理,得到处理后数据;基于处理后数据,进行蛋白质序列编码,提取蛋白质特征;基于蛋白特征,同时对药物和蛋白质的分子机制进行编码,得到第一编码结果;基于处理后数据,将药物和蛋白质的临床信息编码在一起,得到第二编码结果;根据第一编码结果和第二编码结果,计算药物‑蛋白质对的相互作用概率。本申请同时考虑了药物和蛋白质的化学属性、分子机制和临床功能;将药物和蛋白质的原始特征投影到了共同的嵌入子空间中;通过分析药物和蛋白质的特征的一致性,探究药物与蛋白质的作用机制。

    基于扩散-降噪的单细胞转录组测序数据补插方法及系统

    公开(公告)号:CN114974421A

    公开(公告)日:2022-08-30

    申请号:CN202210552055.8

    申请日:2022-05-20

    Applicant: 南开大学

    Inventor: 刘健 潘逸辰 陈娇

    Abstract: 本发明提出了一种基于扩散‑降噪的单细胞转录组测序数据补插方法及系统,包括:获取单细胞转录组测序数据矩阵并进行预处理;对于预处理后的单细胞转录组测序数据矩阵中基因基于概率分布确定补插位点,对补插位点进行扩散操作,完成初步补插;对完成初步补插的单细胞转录组测序数据矩阵基于主成分分析进行白化;对原始获取的单细胞转录组测序数据矩阵进行加权处理,获得细胞间权重图;基于主成分分析白化后的单细胞转录组测序数据矩阵和细胞间权重图通过训练好的神经网路模型输出原始单细胞转录组测序数据。通过扩散‑降噪两阶段的补插处理,能够提高后续对不同细胞的识别的准确性。

    基于Hi-C测序数据的TAD识别方法及系统

    公开(公告)号:CN114944190A

    公开(公告)日:2022-08-26

    申请号:CN202210512716.4

    申请日:2022-05-12

    Applicant: 南开大学

    Inventor: 刘健 李平静 陈娇

    Abstract: 本发明公开了基于Hi‑C测序数据的TAD识别方法及系统;其中,所述方法包括:获取单条染色体的Hi‑C测序数据;对单条染色体的Hi‑C测序数据进行分段,生成若干个染色体片段;对每个染色体片段进行TAD结构识别;根据识别的TAD结构,识别假阳性结果。充分利用了整条染色体Hi‑C测序数据,提高了精度;同时引入随机重启游走算法和惩罚操作,通过惩罚系数有效的限制了基因变异带来的影响。

    一种微生物宏基因组分箱方法及系统

    公开(公告)号:CN113205856B

    公开(公告)日:2022-07-12

    申请号:CN202110693173.6

    申请日:2021-06-22

    Applicant: 南开大学

    Inventor: 刘健 田妹 陈娇

    Abstract: 本公开提供了一种微生物宏基因组分箱方法及系统,包括:获取待分箱的微生物宏基因组序列;对所述宏基因组序列中每条序列进行特征提取,将提取的特征输入VAE‑GAN神经网络中进行训练,通过训练将提取的特征编码到VAE隐含向量中;基于所述VAE隐含向量中的均值变量,对所述宏基因组序列进行聚类,实现宏基因组的分箱;相对于现有方法,本公开所述方案采用了多种特征融合的方式,对宏基因组的序列特征进行深度挖掘,实现了对宏基因组序列的精确描述,同时,为了提高算法的处理效率,利用VAE‑GAN神经网络对所提取的特征进行特征降维,所述降维方法在降低特征维度的同时,充分保留了序列特征中的必要成分,良好的平衡了分箱精度与分箱时间的关系。

    一种宏转录组测序数据处理方法及系统

    公开(公告)号:CN113257348A

    公开(公告)日:2021-08-13

    申请号:CN202110578344.0

    申请日:2021-05-26

    Applicant: 南开大学

    Inventor: 刘健 田妹 陈娇

    Abstract: 本公开提供了一种宏转录组测序数据处理方法及系统,获取宏转录组测序数据;对获取的测序数据进行过滤;对过滤后的测序数据进行组装;根据组装后的测序数据和预设基于原核生物的基因结构特征的概率预测模型,得到测序数据中原核生物的基因预测结果;对得到的测序数据基因结构预测结果添加功能注释;根据基因预测结果的基因定量结果,对添加功能注释后的注释结果进行定量处理。本公开通过对测序数据的过滤、组装、基因预测和注释,实现了宏转录组测序数据更准确和快速的处理,实现了宏转录组基因的更精准和高效注释,提高了宏转录组测序数据的后续处理效率。

    一种基于mvAUC的互补差异表达基因选取方法

    公开(公告)号:CN112802555A

    公开(公告)日:2021-05-14

    申请号:CN202110147526.2

    申请日:2021-02-03

    Applicant: 南开大学

    Abstract: 本发明提出一种基于多变量AUC的特征选择方法,从癌症的差异表达数据中选择最互补的基因子集,实现全局分类性能最大化。本发明首先基于特征的可能误分类集提出一种AUC计算的新角度;然后对于一个特征集,确定其共同可能误分类集并计算每个特征组合后的新AUC;一个特征的新AUC与原始AUC的差值展示了组合后特征集中的其他特征对该特征分类能力的互补作用。最后基于特征组合后的新AUC计算mvAUC,并增量式的选择使当前mvAUC最大化的候选特征加入被选特征子集。本发明方法具有可以直接评估被选特征子集的全局类辨别能力的优点,不需要成对地计算候选特征和每个被选特征之间的冗余信息。

    数据确定方法和装置、存储介质及电子装置

    公开(公告)号:CN110400164B

    公开(公告)日:2024-06-14

    申请号:CN201910395481.3

    申请日:2019-05-13

    Abstract: 本发明公开了一种数据确定方法和装置、存储介质及电子装置。其中,该方法包括:获取基于数据投放平台投放的目标资源执行操作所生成的操作数据;使用与第一加密算法匹配的密钥对操作数据进行加密处理,得到第一加密操作数据;将第一加密操作数据发送给数据投放平台,并获取数据投放平台返回的第二加密操作数据和第一目标数据;对第二加密操作数据进行解密处理,得到第二目标数据;获取第一目标数据及第二目标数据之间的交集;根据交集确定与目标资源相匹配的资源转化率。本发明解决了相关技术提供的数据确定方法容易泄露数据导致难以保证数据安全性的技术问题。

Patent Agency Ranking