RNA序列修饰预测模型的训练方法、预测方法及相关装置

    公开(公告)号:CN119811471A

    公开(公告)日:2025-04-11

    申请号:CN202411742626.X

    申请日:2024-11-29

    Abstract: 本申请涉及一种RNA序列修饰预测模型的训练方法、预测方法及相关装置。所述方法包括:获取RNA序列的修饰位点测序数据;基于修饰位点测序数据中具有目标化学修饰的位点和不具有目标化学修饰的位点,分别得到长度不同的多种正样本序列和在中心位置添加有不同碱基的多种负样本序列,以此构建多层次分类数据库;将多层次分类数据库中的每个样本序列分别输入待训练的修饰预测模型,得到每个样本序列的修饰位点的预测结果;基于预测结果和每个样本序列的实际情况,对待训练的修饰预测模型的模型参数进行更新,直到得到训练后的修饰预测模型。与现有技术相比,本申请能够对提高模型的训练效率和精度。

    细胞表征模型预训练方法、细胞下游任务处理方法、设备、存储介质和程序产品

    公开(公告)号:CN119832987A

    公开(公告)日:2025-04-15

    申请号:CN202411742754.4

    申请日:2024-11-29

    Abstract: 本申请涉及生物技术领域,提供一种细胞表征模型预训练方法、细胞下游任务处理方法、设备、可读存储介质和程序产品,能够提高细胞表征准确性。细胞表征模型预训练方法包括:确定细胞样本集的多个特征基因,及获取细胞样本集中多个样本细胞各自对应的第一特征基因序列;根据多个特征基因匹配得到多条用于实现不同生物学功能的基因通路;由待训练的细胞表征模型根据各第一特征基因序列和各基因通路,确定各样本细胞对应的细胞编码信息,根据细胞编码信息预测各样本细胞对应的第二特征基因序列;根据样本细胞对应的第二特征基因序列与第一特征基因序列的差异,调整细胞表征模型,直到满足训练结束条件,得到预训练的细胞表征模型。

    mRNA序列核糖体占有率的预测方法、模型训练方法及相关装置

    公开(公告)号:CN119724339A

    公开(公告)日:2025-03-28

    申请号:CN202411742605.8

    申请日:2024-11-29

    Abstract: 本申请涉及一种mRNA序列核糖体占有率的预测方法、模型训练方法及相关装置。所述方法包括:获取mRNA序列以及mRNA序列在目标细胞类型中的二级结构;将mRNA序列及其二级结构输入预先训练的预测模型,通过预测模型中的不同编码器分别得到mRNA序列的第一嵌入表示和二级结构的第二嵌入表示,基于多头自注意力机制融合第一嵌入表示和第二嵌入表示,得到融合后的嵌入表示,并基于融合后的嵌入表示进行分类;基于预测模型的分类输出,得到在目标细胞类型中mRNA序列的核糖体占有率的预测结果。与现有技术相比,本申请的预测模型在任意一种细胞类型中进行训练后在其他任何细胞类型上进行核糖体占有率的预测,预测精度高,预测模型可迁移性强。

    一种RNA标记物及包含该标记物的活细胞标记方法和应用

    公开(公告)号:CN112816395B

    公开(公告)日:2022-05-10

    申请号:CN202011612806.8

    申请日:2020-12-30

    Applicant: 北京大学

    Abstract: 本发明涉及活细胞检测技术领域,尤其涉及一种RNA标记物及包含该标记物的活细胞标记方法和应用。所述方法包括标记待测基因,具体为使用RNA标记物一对一地标记待检测基因,所述RNA标记物包含多个茎环结构;其中,每个茎环结构独立地选自两种不同的茎环结构;任意两个不同的RNA标记物之间,所述两种不同的茎环结构中的任一种占自身茎环结构总数比例的差值为15~50%。本发明利用不同的RNA茎环结构标记基因后相对荧光强度和绝对荧光强度不同的原理实现了同时对更多种mRNA的标记和观测,拓展了可用的mRNA标记物数量,节约了所用荧光蛋白种类,对于复杂的基因网络的成像和生物学过程研究具有重要意义。

    通过自主复制RNA实现哺乳动物细胞中的定向进化和达尔文适应

    公开(公告)号:CN116064597B

    公开(公告)日:2024-04-26

    申请号:CN202310078321.2

    申请日:2023-01-17

    Applicant: 北京大学

    Inventor: 马良 林一瀚

    Abstract: 本发明涉及一种正交的甲病毒RNA复制系统REPLACE系统来进化基于RNA的元件,使RNA复制酶辅助的哺乳动物细胞的持续体内进化成为可能。本发明的方法能够持续多样化和选择超过10亿的自主复制RNA拷贝,通过复制酶限制模式的RNA复制和强大的可诱导的RNA突变。本发明进化了荧光蛋白、转录因子和微型Cas蛋白(dCasMINI)的新功能或改进了现有功能。本发明表明,装备了REPLACE的细胞可以通过不断进化携带癌症相关的关键基因(即MEK1和KRAS)的自主复制RNA来适应细胞外部或内部的挑战。本发明的全新的基于RNA的进化平台将为哺乳动物合成生物学提供新的高性能的工具箱,并助力哺乳动物细胞和组织的适应性工程改造。

    通过自主复制RNA实现哺乳动物细胞中的定向进化和达尔文适应

    公开(公告)号:CN116064597A

    公开(公告)日:2023-05-05

    申请号:CN202310078321.2

    申请日:2023-01-17

    Applicant: 北京大学

    Inventor: 马良 林一瀚

    Abstract: 本发明涉及一种正交的甲病毒RNA复制系统REPLACE系统来进化基于RNA的元件,使RNA复制酶辅助的哺乳动物细胞的持续体内进化成为可能。本发明的方法能够持续多样化和选择超过10亿的自主复制RNA拷贝,通过复制酶限制模式的RNA复制和强大的可诱导的RNA突变。本发明进化了荧光蛋白、转录因子和微型Cas蛋白(dCasMINI)的新功能或改进了现有功能。本发明表明,装备了REPLACE的细胞可以通过不断进化携带癌症相关的关键基因(即MEK1和KRAS)的自主复制RNA来适应细胞外部或内部的挑战。本发明的全新的基于RNA的进化平台将为哺乳动物合成生物学提供新的高性能的工具箱,并助力哺乳动物细胞和组织的适应性工程改造。

    一种RNA标记物及包含该标记物的活细胞标记方法和应用

    公开(公告)号:CN112816395A

    公开(公告)日:2021-05-18

    申请号:CN202011612806.8

    申请日:2020-12-30

    Applicant: 北京大学

    Abstract: 本发明涉及活细胞检测技术领域,尤其涉及一种RNA标记物及包含该标记物的活细胞标记方法和应用。所述方法包括标记待测基因,具体为使用RNA标记物一对一地标记待检测基因,所述RNA标记物包含多个茎环结构;其中,每个茎环结构独立地选自两种不同的茎环结构;任意两个不同的RNA标记物之间,所述两种不同的茎环结构中的任一种占自身茎环结构总数比例的差值为15~50%。本发明利用不同的RNA茎环结构标记基因后相对荧光强度和绝对荧光强度不同的原理实现了同时对更多种mRNA的标记和观测,拓展了可用的mRNA标记物数量,节约了所用荧光蛋白种类,对于复杂的基因网络的成像和生物学过程研究具有重要意义。

    一种无膜转录调控器及其在精准调控基因表达中的应用

    公开(公告)号:CN113584022A

    公开(公告)日:2021-11-02

    申请号:CN202110785192.1

    申请日:2021-07-12

    Applicant: 北京大学

    Inventor: 吴结根 林一瀚

    Abstract: 本发明涉及一种无膜转录调控器及其在精准调控基因表达中的应用。本发明基于内在无序序列或多价肽段相互作用形成低聚合物,结合蛋白与蛋白之间相互作用,构建可由小分子诱导或光诱导的转录因子聚集系统,称为无膜转录调控器,将该调控器应于基因表达调控,能够在不同小分子浓度或不同光诱导下,通过改变化学小分子的浓度或光强度诱导转录因子不同程度的聚集,改变转录因子的聚集状态,提高转录因子的激活能力,显著激活下游基因的表达,从而实现基因表达的高效精准调控。

Patent Agency Ranking