-
公开(公告)号:CN113160881B
公开(公告)日:2023-10-20
申请号:CN202110525570.2
申请日:2021-05-14
Applicant: 东北大学
IPC: G16B40/00 , G16B20/00 , G06F18/2113 , G06F18/2415 , G06F18/214 , G06N3/006
Abstract: 本发明提供一种基于mRMR和MBFA的高维数据特征选择方法,涉及机器学习技术领域。本发明利用mRMR(Max‑Relevance and Min‑Redundancy,最大相关最小冗余)对基因数据进行初步筛选,过滤到包含信息量较少的特征;对于过滤后的特征,通过MBFA(Multilayer Binary Firefly Algorithm,多层二进制萤火虫算法)完成最优特征子集的选择,该方式最终选择的特征冗余度觉少同时实现了较好的模型效果。此外,该方法能够从高维基因微阵列数据中发现寻找用于疾病辅助预测的生物标志物,对于后续研究和预测模型的建立具有重要意义。
-
公开(公告)号:CN112232413B
公开(公告)日:2023-07-21
申请号:CN202011108087.6
申请日:2020-10-16
Applicant: 东北大学
IPC: G06F18/2113 , G06F18/23213 , G06F18/2411 , G06N3/048 , G06N3/084 , G16B40/00
Abstract: 本发明提供一种基于图神经网络与谱聚类的高维数据特征选择方法。首先将每个基因作为节点建立基因关系图结构模型,并将基因相互关系数据作为边信息添加到基因关系图中,然后利用图神经网络模型来获取节点的特征向量表示,在得到每个节点的特征向量表示之后,开始进行链接预测阶段,生成新的边,得到新的基因关系图,最后基于谱聚类在新的基因关系图中选择权重最高的节点作为特征节点,通过本发明最终选择的基因具有较小的冗余度同时实现了较好的模型效果,并支持生物角度的可解释性。
-
公开(公告)号:CN113177604A
公开(公告)日:2021-07-27
申请号:CN202110525604.8
申请日:2021-05-14
Applicant: 东北大学
Abstract: 本发明提供一种基于改进L1正则化和聚类的高维数据特征选择方法,涉及机器学习技术领域。本发明提出了一种混合特征选择算法用于微阵列数据分析,基于K‑Means聚类算法和改进L1正则化的思想,其中K‑Means聚类算法用于数据预处理来删除冗余特征,改进L1正则化方法用于特征选择,提高稳定性和分类准确率。
-
公开(公告)号:CN113160881A
公开(公告)日:2021-07-23
申请号:CN202110525570.2
申请日:2021-05-14
Applicant: 东北大学
Abstract: 本发明提供一种基于mRMR和MBFA的高维数据特征选择方法,涉及机器学习技术领域。本发明利用mRMR(Max‑Relevance and Min‑Redundancy,最大相关最小冗余)对基因数据进行初步筛选,过滤到包含信息量较少的特征;对于过滤后的特征,通过MBFA(Multilayer Binary Firefly Algorithm,多层二进制萤火虫算法)完成最优特征子集的选择,该方式最终选择的特征冗余度觉少同时实现了较好的模型效果。此外,该方法能够从高维基因微阵列数据中发现寻找用于疾病辅助预测的生物标志物,对于后续研究和预测模型的建立具有重要意义。
-
公开(公告)号:CN112232413A
公开(公告)日:2021-01-15
申请号:CN202011108087.6
申请日:2020-10-16
Applicant: 东北大学
Abstract: 本发明提供一种基于图神经网络与谱聚类的高维数据特征选择方法。首先将每个基因作为节点建立基因关系图结构模型,并将基因相互关系数据作为边信息添加到基因关系图中,然后利用图神经网络模型来获取节点的特征向量表示,在得到每个节点的特征向量表示之后,开始进行链接预测阶段,生成新的边,得到新的基因关系图,最后基于谱聚类在新的基因关系图中选择权重最高的节点作为特征节点,通过本发明最终选择的基因具有较小的冗余度同时实现了较好的模型效果,并支持生物角度的可解释性。
-
公开(公告)号:CN113177604B
公开(公告)日:2024-04-16
申请号:CN202110525604.8
申请日:2021-05-14
Applicant: 东北大学
IPC: G06F18/2113 , G06F18/23213 , G06F18/24 , G16B40/00
Abstract: 本发明提供一种基于改进L1正则化和聚类的高维数据特征选择方法,涉及机器学习技术领域。本发明提出了一种混合特征选择算法用于微阵列数据分析,基于K‑Means聚类算法和改进L1正则化的思想,其中K‑Means聚类算法用于数据预处理来删除冗余特征,改进L1正则化方法用于特征选择,提高稳定性和分类准确率。
-
公开(公告)号:CN117672377A
公开(公告)日:2024-03-08
申请号:CN202311653128.3
申请日:2023-12-05
Applicant: 东北大学
Abstract: 本发明提供一种基于URD的细胞轨迹分析方法,涉及细胞轨迹分析技术领域。该方法首先根据已知的基因表达信息得到细胞之间的距离矩阵,并将距离矩阵转化为转移概率矩阵,进而计算出细胞扩散图;再以细胞扩散图中构成根部结点的细胞为初始点,基于吸收马尔可夫链在细胞回溯过程中进行有偏扩散,生成游走轨迹的树状结构;最后估计树状结构中细胞分化轨迹上的分支结点,沿着拟时序顺序形成树结构形态的分化轨迹。该方法在估计分支点并确定分化轨迹的回溯阶段,优化后的有偏扩散算法能够增加细胞的覆盖量、构建更完整的发育树并且更加深入地探索细胞在发育过程中的分化路径,与URD相比,耗时低、运行效率更高。
-
-
-
-
-
-