一种基于聚类和距离加权的不平衡数据分类方法

    公开(公告)号:CN114841241A

    公开(公告)日:2022-08-02

    申请号:CN202210346871.3

    申请日:2022-03-31

    Inventor: 张奕 蔡钢生

    Abstract: 本发明公开了一种基于聚类和距离加权的不平衡数据分类方法,主要解决现有技术在少数类类内分布不连续的不平衡数据上分类精度低的问题。其实现步骤为:(1)采集不平衡数据集并分为多数类、少数类样本集;(2)对多数类、少数类样本集进行非重叠划分;(3)基于类簇间距离计算样本权重;(4)多数类边界样本降权;(5)使用样本及其权重训练加权支持向量机分类器;(6)对待测样本进行分类。本发明能有效描述两类样本在特征空间中的相对分布关系,并在此基础上根据样本的相对重要性赋予样本权重,有利于构建正确的分类边界并提高少数类分类精度,可用于分布情况复杂的不平衡数据的分类。

    一种基于图卷积神经网络和node2vec的circRNA-疾病关联关系预测方法

    公开(公告)号:CN114999635B

    公开(公告)日:2025-02-21

    申请号:CN202210702017.6

    申请日:2022-06-20

    Abstract: 一种基于图卷积神经网络和Node2vec的circRNA‑疾病关联关系预测方法,步骤如下:获取circRNA‑疾病关联矩阵;计算circRNA功能相似性、circRNA高斯相互作用谱核相似性、疾病高斯相互作用谱核相似性、疾病语义相似性,构建circRNA集成相似性和疾病集成相似性,生成circRNA‑疾病异构图;稀疏自动编码器对circRNA(疾病)集成相似性进行特征提取和变换后转为64维特征向量,融合circRNA特征向量和疾病特征向量为最终的circRNA‑疾病特征向量;图卷积神经网络对circRNA‑疾病异构图提取节点的局部结构信息;Node2vec方法对circRNA‑疾病异构图提取节点的全局结构信息;将前两步得到的节点信息送入到随机森林分类器中,预测潜在的circRNA‑疾病关联关系。通过计算方法预测与疾病相关的circRNA,节省时间,有助于阐明疾病发病机制,寻找有效治疗方案。

    一种基于图卷积神经网络和node2vec的circRNA-疾病关联关系预测方法

    公开(公告)号:CN114999635A

    公开(公告)日:2022-09-02

    申请号:CN202210702017.6

    申请日:2022-06-20

    Abstract: 一种基于图卷积神经网络和Node2vec的circRNA‑疾病关联关系预测方法,步骤如下:获取circRNA‑疾病关联矩阵;计算circRNA功能相似性、circRNA高斯相互作用谱核相似性、疾病高斯相互作用谱核相似性、疾病语义相似性,构建circRNA集成相似性和疾病集成相似性,生成circRNA‑疾病异构图;稀疏自动编码器对circRNA(疾病)集成相似性进行特征提取和变换后转为64维特征向量,融合circRNA特征向量和疾病特征向量为最终的circRNA‑疾病特征向量;图卷积神经网络对circRNA‑疾病异构图提取节点的局部结构信息;Node2vec方法对circRNA‑疾病异构图提取节点的全局结构信息;将前两步得到的节点信息送入到随机森林分类器中,预测潜在的circRNA‑疾病关联关系。通过计算方法预测与疾病相关的circRNA,节省时间,有助于阐明疾病发病机制,寻找有效治疗方案。

Patent Agency Ranking