-
公开(公告)号:CN102789551A
公开(公告)日:2012-11-21
申请号:CN201110125025.0
申请日:2011-05-16
Applicant: 中国科学院上海生命科学研究院 , 上海生物信息技术研究中心 , 上海交通大学
IPC: G06F19/18
Abstract: 本发明公开了用图形处理单元加速元基因组的物种分析的方法和系统,在保持和现有Phymm系统相似准确性的同时,可以比现有的Phymm系统快至少两个数量级。其技术方案为:方法包括:从训练集中预先构建k阶马尔科夫模型;将构建好的k阶马尔科夫模型载入到图像处理单元中;将待分类的序列转换为寡核苷酸频数向量;将寡核苷酸频数向量载入到图像处理单元中;在图像处理单元中计算序列和每一个已知基因组的相似性分数;将这些相似性分数送回主内存;处理器用这些相似性分数最小的基因组的物种信息注释序列。