一种基于度量学习的系统发生树构建方法

    公开(公告)号:CN120067895A

    公开(公告)日:2025-05-30

    申请号:CN202510533729.3

    申请日:2025-04-27

    Abstract: 本发明涉及一种基于度量学习的系统发生树构建方法。它解决了现有技术中系统发生树构建计算复杂度高且效率低下,准确度不佳的问题。它包括S1、收集包含核酸序列及对应已构建进化树的公开数据集;S2、对收集的数据集进行特征提取;S3、设计并构建度量学习模型,优化数据点之间的相似性度量;S4、使用训练集对度量学习模型进行训练并生成相似性矩阵;S5、基于生成的相似性矩阵,使用系统发生树构建算法构建树形结构并进行结果验证;S6、应用分析。本发明的优点在于:克服了传统方法中距离测量精度低、模型假设局限性强、计算复杂度高等问题,实现了大规模生物数据下系统发生树的高效构建。

    基于知识增强语言模型的蛋白质相互作用调节剂预测方法、系统和计算机可读存储介质

    公开(公告)号:CN119993283A

    公开(公告)日:2025-05-13

    申请号:CN202510464934.9

    申请日:2025-04-15

    Abstract: 本发明公开了一种基于知识增强语言模型的蛋白质相互作用调节剂预测方法,包括,调节剂模型构建:预训练文本编码器,引入基于指纹的结构编码器,拼接文本编码器输出的文本嵌入和结构编码器输出的多种指纹嵌入生成调节剂特征;蛋白质模型构建:收集GO图和GO注释,基于GO图训练图嵌入模型,使用训练后的图嵌入模型为每个GO术语节点生成结构特征,结合GO术语的结构特征输出GO术语嵌入向量,基于多个GO术语嵌入向量生成蛋白质特征;预测模型构建:以调节剂特征和蛋白质特征为输入,输出相互作用特征,并基于相互作用特征输出预测结果。本方案通过自然语言的细微表达与生物分子结构属性的融合实现了蛋白质相互作用调节剂预测性能的有效提升。

    一种基于鲁棒多核集成方法的药物靶点交互预测方法及其系统

    公开(公告)号:CN119207547A

    公开(公告)日:2024-12-27

    申请号:CN202411710162.4

    申请日:2024-11-27

    Abstract: 本发明公开了一种基于鲁棒多核集成方法的药物靶点交互预测方法及其系统,该方法包括,构建目标函数,包括关于预测交互矩阵的损失函数,集成学习项和正则项;以已知交互矩阵、药物相似核矩阵集合和靶点相似核矩阵集合为训练数据训练模型以优化所述的目标函数;所述药物相似核矩阵集合包含待测药物,靶点相似核矩阵集合包含待测靶点;训练结束后,模型输出包含待测药物与待测靶点交互置信度的预测交互矩阵。本方案模型利用多核学习、多视角信息融合以及集成学习策略,结合鲁棒损失函数,通过训练在药物‑靶点相互作用矩阵进行重建,可通过对未知药物‑靶点相互作用的预测,扩展已有的药物靶标数据库。

    一种抗猴痘病毒的新型结构化合物及其应用

    公开(公告)号:CN118955599A

    公开(公告)日:2024-11-15

    申请号:CN202411002478.8

    申请日:2024-07-25

    Inventor: 张鑫 邹权 魏彦明

    Abstract: 本发明属于设计药学和猴痘病毒感染药物领域,公开了一种抗猴痘病毒的新型结构化合物及其应用,为一种具有抗VP37蛋白酶活性化合物;通过先进的分子技术确保了结构的准确性与特异性;所描述的化合物具有特异的IUPAC命名和结构,在生物或医药领域有特定的活性和应用;提供了新的化合物结构作为的药物或研究工具的候选物,拓展了现有的化合物库。该发明通过采用分子对接和分子动力学模拟的方法对多个蛋白小分子体系进行拟合,根据打分函数,结合能计算和RMSD数值等多个维度与参照化合物对比分析出化合物具有抗猴痘病毒的活性,该种化合物能成为治疗猴痘病毒的药物。

    用于混杂特征肺癌数据分析的多核几何平均度量学习方法及设备

    公开(公告)号:CN117972448A

    公开(公告)日:2024-05-03

    申请号:CN202410157765.X

    申请日:2024-02-04

    Abstract: 用于混杂特征肺癌数据分析的多核几何平均度量学习方法及设备,属于肺癌数据分析挖掘技术领域。为了解决现有传统的度量学习在对肺癌数据进行度量时不仅针对符号型数据处理不合理,忽略数据特征中存在混杂异构差异等问题。本发明将肺癌数据根据数值型和符号型这两种特征类型进行拆分;每个样本的每种类型的特征分别按照数值型和符号型进行处理;对于符号型特征进行汉明距离处理得到汉明矩阵,并直接构建样本特征矩阵,然后分别通过高斯核函数计算,得到各自对应的核特征矩阵;肺癌数据经核函数映射到再生核希尔伯特空间,在再生核希尔伯特空间计算特征间的马氏距离来衡量样本距离;基于多核几何平均度量学习的目标函数进行迭代优化。

    一种III型分泌系统效应蛋白识别方法及装置

    公开(公告)号:CN113838520B

    公开(公告)日:2024-03-29

    申请号:CN202111136236.4

    申请日:2021-09-27

    Abstract: 本发明提供一种III型分泌系统效应蛋白识别方法及装置,方法为导入III型分泌系统效应蛋白序列数据文件,获取原始III型分泌系统效应蛋白数据集;从原始III型分泌系统效应蛋白数据集中提取数据特征,根据数据特征构建特征矩阵;对特征矩阵进行标签设置,得到第一III型分泌系统效应蛋白基分类器;构建特征相似度评分矩阵;通过特征相似度评分矩阵构建第二III型分泌系统效应蛋白基分类器;根据集成策略将第一III型分泌系统效应蛋白基分类器和第二III型分泌系统效应蛋白基分类器集成III型分泌系统效应蛋白模型;本发明提出了一种全新的III型分泌系统效应蛋白识别方法,生成了综合性能更优,得到应用更加广泛的III型分泌系统效应蛋白模型。

Patent Agency Ranking