-
公开(公告)号:CN102419774B
公开(公告)日:2013-04-03
申请号:CN201110418812.4
申请日:2011-12-15
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。
-
公开(公告)号:CN102419774A
公开(公告)日:2012-04-18
申请号:CN201110418812.4
申请日:2011-12-15
Applicant: 上海大学
IPC: G06F17/30
Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。
-