转录组序列分类方法、装置、电子设备及可读存储介质

    公开(公告)号:CN114496070A

    公开(公告)日:2022-05-13

    申请号:CN202210074550.2

    申请日:2022-01-21

    Applicant: 北京大学

    Abstract: 本发明实施例提供了一种转录组序列分类方法、装置、电子设备及计算机可读存储介质,本发明实施例中,转录组序列分类预测模型预先学习了多个已知类别的微生物的转录组序列的碱基序列、密码子序列和氨基酸序列,从而,本发明实施例采用的转录组序列分类预测模型,可以结合待分类转录组序列的碱基序列、密码子序列和氨基酸序列,准确地预测该待分类转录组序列所属的微生物类别。本发明实施例中,通过对转录组序列进行比对和预测,可以确定转录组序列所属的微生物类别。从而可以从虫媒介宏转录组中发现更多的未知的RNA病毒(主要的人类病毒),以作为疾病的检测、防控,以及新病毒或其他病原体的研究的基础。

    转录组序列分类方法、装置、电子设备及可读存储介质

    公开(公告)号:CN114496070B

    公开(公告)日:2024-11-01

    申请号:CN202210074550.2

    申请日:2022-01-21

    Applicant: 北京大学

    Abstract: 本发明实施例提供了一种转录组序列分类方法、装置、电子设备及计算机可读存储介质,本发明实施例中,转录组序列分类预测模型预先学习了多个已知类别的微生物的转录组序列的碱基序列、密码子序列和氨基酸序列,从而,本发明实施例采用的转录组序列分类预测模型,可以结合待分类转录组序列的碱基序列、密码子序列和氨基酸序列,准确地预测该待分类转录组序列所属的微生物类别。本发明实施例中,通过对转录组序列进行比对和预测,可以确定转录组序列所属的微生物类别。从而可以从虫媒介宏转录组中发现更多的未知的RNA病毒(主要的人类病毒),以作为疾病的检测、防控,以及新病毒或其他病原体的研究的基础。

    病毒分类方法、装置、电子设备及计算机可读存储介质

    公开(公告)号:CN116415190A

    公开(公告)日:2023-07-11

    申请号:CN202111626354.3

    申请日:2021-12-28

    Applicant: 北京大学

    Abstract: 本发明实施例提供了一种病毒分类方法、装置、电子设备及计算机可读存储介质,本发明实施例中,以3‑mer的形式从目标DNA序列中按照顺序提取三联体核苷酸集合,再利用距离依赖函数确定该三联体核苷酸集合对应的距离依赖矩阵。从而利用距离依赖矩阵表示目标DNA序列,作为病毒分类模型的输入,以对目标DNA序列所属类别(真核病毒或者原核病毒)进行预测。本发明实施例中,病毒分类模型预先学习了多个具有标签的已知DNA序列的距离依赖矩阵。从而病毒分类模型不仅可以学习到不同类型的DNA片段的局部信息,还可以学习到顺序信息和远程信息。从而本发明实施例可以利用目标DNA序列对应的距离依赖矩阵,准确地预测得到目标DNA序列所属类别。

Patent Agency Ranking