-
公开(公告)号:CN109559781A
公开(公告)日:2019-04-02
申请号:CN201811244350.7
申请日:2018-10-24
Applicant: 成都信息工程大学
Abstract: 本发明提出了一种预测DNA-蛋白质结合的双向LSTM和CNN模型,其中包括输入层、BLSTM层、卷积层、最大池化层、全连接层和输出层。输入层使用独热编码将每个输入序列表示为4行二进制矩阵;在BLSTM层中,前一层中的每个LSTM模型将从输入序列中接收DNA上感兴趣的信息,对从过去历史信息传递到隐藏状态的贡献进行编码解释;然后将其传播到下一个BLSTM模块中;卷积层中每个卷积核扫描输入的矩阵用于模体发现,不同强度的信息关联潜在的序列模式;最大池化层用于最大化每个卷积核的输出信号使其成一个完整的序列;输出层执行非线性转换以确定DNA-蛋白质结合的特征信息。