-
公开(公告)号:CN107016260A
公开(公告)日:2017-08-04
申请号:CN201710201797.5
申请日:2017-03-30
Applicant: 广东工业大学
IPC: G06F19/20
Abstract: 本发明涉及一种基于跨平台基因表达数据的基因调控网络重建方法,根据跨平台基因表达数据的特点,通过获取来自p个测序平台基因表达数据,并进行预处理,然后从每个基因样本中抽取n个基因表达量,并基于偏相关系数的混合型条件独立性测试得到每个基因表达量的父子节点集,将其应用于跨平台因果网络结构学习的学习网络骨架、确定v‑结构和最大化标志方向三个过程中,从而重建出跨平台基因调控网络,本发明利用因果图模型解决跨平台基因调控网络的问题,能直接有效地利用跨平台基因表达数据进行高维的基因调控网络重建的同时,避免数据预处理过程导致的数据过度平滑等问题,提高了跨平台基因调控网络重建结果的正确率和召回率。
-
公开(公告)号:CN105825078B
公开(公告)日:2019-02-26
申请号:CN201610150049.4
申请日:2016-03-16
Applicant: 广东工业大学
Abstract: 本发明公开了基于基因大数据的小样本基因表达数据分类方法,其技术步骤为:确定训练样本基因表达数据和类标签,构建矩阵;根据L阶频数统计结果和2阶频数统计结果,计算L+1阶估分,去除估分小于阈值的非频繁集;计算到最大阶数Lmax;计算不同类别差异化的缺失情况;对各阶评分表进行排序,建立决策表;根据决策表对测试样本进行判别并输出类别。本发明基于基因大数据的跨平台分类器训练模型,结合基因表达数据公共储存库中海量的数据与小规模基因表达样本混合训练,有效的提高了分类效果。同时,该方法解决了跨平台所带来的缺失值的影响。
-
公开(公告)号:CN107016260B
公开(公告)日:2019-09-13
申请号:CN201710201797.5
申请日:2017-03-30
Applicant: 广东工业大学
Abstract: 本发明涉及一种基于跨平台基因表达数据的基因调控网络重建方法,根据跨平台基因表达数据的特点,通过获取来自p个测序平台基因表达数据,并进行预处理,然后从每个基因样本中抽取n个基因表达量,并基于偏相关系数的混合型条件独立性测试得到每个基因表达量的父子节点集,将其应用于跨平台因果网络结构学习的学习网络骨架、确定v‑结构和最大化标志方向三个过程中,从而重建出跨平台基因调控网络,本发明利用因果图模型解决跨平台基因调控网络的问题,能直接有效地利用跨平台基因表达数据进行高维的基因调控网络重建的同时,避免数据预处理过程导致的数据过度平滑等问题,提高了跨平台基因调控网络重建结果的正确率和召回率。
-
公开(公告)号:CN105825078A
公开(公告)日:2016-08-03
申请号:CN201610150049.4
申请日:2016-03-16
Applicant: 广东工业大学
IPC: G06F19/20
Abstract: 本发明公开了基于基因大数据的小样本基因表达数据分类方法,其技术步骤为:确定训练样本基因表达数据和类标签,构建矩阵;根据L阶频数统计结果和2阶频数统计结果,计算L+1阶估分,去除估分小于阈值的非频繁集;计算到最大阶数Lmax;计算不同类别差异化的缺失情况;对各阶评分表进行排序,建立决策表;根据决策表对测试样本进行判别并输出类别。本发明基于基因大数据的跨平台分类器训练模型,结合基因表达数据公共储存库中海量的数据与小规模基因表达样本混合训练,有效的提高了分类效果。同时,该方法解决了跨平台所带来的缺失值的影响。
-
-
-