一种面向SNP数据的聚类方法

    公开(公告)号:CN102419774B

    公开(公告)日:2013-04-03

    申请号:CN201110418812.4

    申请日:2011-12-15

    Applicant: 上海大学

    Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。

    一种面向SNP数据的聚类方法

    公开(公告)号:CN102419774A

    公开(公告)日:2012-04-18

    申请号:CN201110418812.4

    申请日:2011-12-15

    Applicant: 上海大学

    Abstract: 本发明公开了一种面向SNP数据的聚类方法,具体步骤如下:首先将原始SNP数据进行预处理,转换成聚类方法可以处理的数据格式;然后将预处理后的SNP数据进行网格划分,根据每个SNP位点在每个样本中的表达值将SNP数据的每一维划分为3个网格;然后计算划分后的网格的密度,得到包含聚类的子空间;然后对得到的子空间进行聚类,得到被分好类的SNP数据,每个类是共表达的SNP位点的集合;最后将聚类结果保存到文件中。本发明解决了高维分类型数据的聚类问题,能够快速高质量的对SNP数据进行聚类。

Patent Agency Ranking