用于混杂特征肺癌数据分析的多核几何平均度量学习方法及设备

    公开(公告)号:CN117972448A

    公开(公告)日:2024-05-03

    申请号:CN202410157765.X

    申请日:2024-02-04

    Abstract: 用于混杂特征肺癌数据分析的多核几何平均度量学习方法及设备,属于肺癌数据分析挖掘技术领域。为了解决现有传统的度量学习在对肺癌数据进行度量时不仅针对符号型数据处理不合理,忽略数据特征中存在混杂异构差异等问题。本发明将肺癌数据根据数值型和符号型这两种特征类型进行拆分;每个样本的每种类型的特征分别按照数值型和符号型进行处理;对于符号型特征进行汉明距离处理得到汉明矩阵,并直接构建样本特征矩阵,然后分别通过高斯核函数计算,得到各自对应的核特征矩阵;肺癌数据经核函数映射到再生核希尔伯特空间,在再生核希尔伯特空间计算特征间的马氏距离来衡量样本距离;基于多核几何平均度量学习的目标函数进行迭代优化。

    一种基于DNABERT微调的G-四链体预测方法

    公开(公告)号:CN118447929B

    公开(公告)日:2024-10-11

    申请号:CN202410906104.2

    申请日:2024-07-08

    Abstract: 本发明属于计算机生物学领域,具体涉及一种基于DNABERT微调的G‑四链体预测方法。该基于DNABERT微调的G‑四链体预测方法,包括如下步骤:构建数据集:获取来自不同细胞系的序列数据,使用预测工具预测其中潜在的四链体形成序列PQS;将PQS与通过高通量测序技术得到的G4峰值进行交集处理;将与G4峰值有至少一个碱基对重叠的PQS定义为eG4作为正样本;根据得到的eG4正样本,从人类基因组随机提取多方面特征类似于正样本的序列作为负样本,得到由正样本和负样本构成的数据集;使用所述数据集对DNABERT预训练模型进行微调。本发明提高了对G‑四链体的预测性能,同时还增强了模型的可解释性。

    一种基于DNABERT微调的G-四链体预测方法

    公开(公告)号:CN118447929A

    公开(公告)日:2024-08-06

    申请号:CN202410906104.2

    申请日:2024-07-08

    Abstract: 本发明属于计算机生物学领域,具体涉及一种基于DNABERT微调的G‑四链体预测方法。该基于DNABERT微调的G‑四链体预测方法,包括如下步骤:构建数据集:获取来自不同细胞系的序列数据,使用预测工具预测其中潜在的四链体形成序列PQS;将PQS与通过高通量测序技术得到的G4峰值进行交集处理;将与G4峰值有至少一个碱基对重叠的PQS定义为eG4作为正样本;根据得到的eG4正样本,从人类基因组随机提取多方面特征类似于正样本的序列作为负样本,得到由正样本和负样本构成的数据集;使用所述数据集对DNABERT预训练模型进行微调。本发明提高了对G‑四链体的预测性能,同时还增强了模型的可解释性。

    基于多空间映射的药物与疾病关联预测系统、设备及介质

    公开(公告)号:CN118039024A

    公开(公告)日:2024-05-14

    申请号:CN202410164116.2

    申请日:2024-02-05

    Abstract: 本发明属于生物医学信息技术领域,具体涉及一种基于多空间映射的药物与疾病关联预测系统、设备及介质。为了解决因此现有的药物与疾病关联预测系统因为无法进行多空间的联合可视化映射从而存在潜在的疾病‑药物关联预测准确率低的问题,提供了基于多空间映射的药物与疾病关联预测系统,可以更好的利用原始空间内的结构信息和多空间之间的关联信息,可以有效的补全并构建全连接模型,以获得更好的关联预测结果,因此解决了现有的药物与疾病关联预测系统因为无法进行多空间的联合可视化映射从而存在潜在的疾病‑药物关联预测准确率低的问题。

    基于功能性磁共振成像的自闭症识别系统

    公开(公告)号:CN118021258A

    公开(公告)日:2024-05-14

    申请号:CN202410164113.9

    申请日:2024-02-05

    Abstract: 本发明属于生物医学信息技术领域,具体涉及一种基于功能性磁共振成像的自闭症识别系统。本发明针对现有分析系统中存在缺乏局部关联信息、异步关联信息导致分析系统识别自闭症谱系障碍疾病的准确率低的问题;本发明从概率分布的角度,充分统计了原始图像数据的上下文信息,同异步关联信息等,能有效、准确地分析精神类疾病患者在功能性磁共振成像中的差异及病理变化;采用多尺度多变量的方式计算时间序列之间的相互关系,能够更好的挖掘其内在的相关性;本专利充分考虑了时间序列之间异步性和局部性的特点,模型方法有效统计并计算了两个时间序列之间的异步关联性和局部特异性,可以更好的识别自闭症。

Patent Agency Ranking