-
公开(公告)号:CN105740653A
公开(公告)日:2016-07-06
申请号:CN201610057637.3
申请日:2016-01-27
Applicant: 北京工业大学
IPC: G06F19/24
CPC classification number: G16B40/00
Abstract: 本发明为基于LLRFC和相关性分析去除冗余的特征选择方法LLRFC score+,DNA微阵列技术为临床肿瘤的诊断提供了一个新的方向。不同类型的肿瘤所对应的表达谱数据表现迥异,通过对肿瘤基因表达谱数据的分析,研究人员可以在分子水平上实现对肿瘤及其亚型的准确识别,这对肿瘤的诊断和治疗具有重要的生物学意义。利用LLRFC判别准则降序排列表达谱数据中的特征基因,结合动态相关性分析的策略进一步排除冗余特征,提出LLRFC score+的算法,选择最佳特征基因子集。本发明能有效提升分类器的分类精度,并且不要求样本数据集必须满足正态分布,适用于多种分布类型的数据。本发明可以帮助人们寻找癌症的致病基因,有助于临床上肿瘤疾病的早期诊断、肿瘤分期分型及预后治疗等。
-
公开(公告)号:CN104200134A
公开(公告)日:2014-12-10
申请号:CN201410438692.8
申请日:2014-08-30
Applicant: 北京工业大学
Abstract: 一种基于局部线性嵌入算法的肿瘤基因表数据特征选择方法,根据肿瘤基因表达数据的类别信息计算邻域,为了更好地利用类别信息,重新定义一种新的距离表达方式,I相同标签样本之间的距离;II不同标签样本之间的距离;分别计算类内与类外样本点的重构权;判别准则;特征评价函数。本发明具有LLE Score算法可以将高维的邻域信息保留在低维结构里,并可以很好地利用标签信息,同时计算代价小等特点。可以根据特征选择后的降维效果,对基因数据进行有效的分类。
-
公开(公告)号:CN104200135A
公开(公告)日:2014-12-10
申请号:CN201410438783.1
申请日:2014-08-30
Applicant: 北京工业大学
IPC: G06F19/24
Abstract: 一种基于MFA score和排除冗余的基因表达谱特征选择方法,肿瘤基因表达谱的特征选择和分类有助于肿瘤的早期诊断,从基因表达的角度解释肿瘤的成因。首先利用MFA score算法构造类间近邻矩阵Wb和类内近邻矩阵Ww,进而得到类间拉普拉斯矩阵Lb和类内拉普拉斯矩阵Lw,最后将基因排序。针对基因表达数据的高冗余这一特点,我们利用Pearson相关系数来判断基因间的相关性,将高相关的基因即冗余基因排除,最终得到基因子集。本发明适用于任意空间分布的训练样本,排除冗余基因进一步缩减了特征维数,算法复杂度较小,实验中取得了较高的分类准确率。
-
公开(公告)号:CN105205345A
公开(公告)日:2015-12-30
申请号:CN201510542519.7
申请日:2015-08-28
Applicant: 北京工业大学
Abstract: 基于ShRec3D和转换参数优化的染色体3D结构建模方法,将基因片段之间的交互频率转换为空间距离,进一步构建基因组的三维空间结构。该方法,首先通过黄金分割算法寻找最优的转换参数,将两个染色体片段之间的交互作用频率,转化为两个片段之间的空间距离;进而应用最短距离算法构建基因组的空间距离图谱,最后用MDS算法得到三维空间中各个基因片段的相对坐标图,对染色体的三维空间结构可视化。并用均方根误差RMSD和Spearman相关系数度量构建的染色体结构的相似性。本发明对不同分辨率下的Hi-C数据集,能寻找最优的转换参数,提高了ShRec3D算法的准确性和鲁棒性,可用于染色体3D结构的建模。
-
-
-