一种融合知识图谱的基因序列预训练方法和装置

    公开(公告)号:CN115810392A

    公开(公告)日:2023-03-17

    申请号:CN202211615708.9

    申请日:2022-12-15

    Applicant: 浙江大学

    Abstract: 本发明公开了一种融合知识图谱的基因序列预训练方法和装置,通过考虑基因之间调控关系构建基因调控图谱,并在基因调控图谱中增加motif和bin来构建基于基因调控网络的知识图谱,进而学习基因在知识图谱中的基因表示,并将知识图谱中的基因表示作为特殊token引入基因的基因序列中,提升了MLM模型对mask的预测准确性,并得到准确性的基因表示,将序列中学到的基因表示作为扩充基因调控图谱中基因的初始向量,再次经过可插拔表示模型提取基因表示,这样交替过程实现了知识图谱信息和基因序列信息的交互,利用交互训练的MLM模型提取基因表示,能够提升进而提升基因相关性质预测的准确性。

Patent Agency Ranking