-
公开(公告)号:CN108959841A
公开(公告)日:2018-12-07
申请号:CN201810336860.0
申请日:2018-04-16
Applicant: 华南农业大学
CPC classification number: G06N3/0454 , G06N3/08 , G06N3/084
Abstract: 本发明公开了一种基于DBN算法的药物靶向蛋白作用预测方法,该方法是从药物的分子结构出发,提取药物的扩展连通指纹,从蛋白质的氨基酸序列出发,提取了蛋白质的三肽结构特征,将药物的扩展连通指纹和蛋白质的三肽结构特征两两拼接,构造成一个药物-蛋白质特征向量,之后输入到深度置信网络中进行训练,网络的输出为网络输入的药物-蛋白质对发生相互作用的概率,最后选择合适的阈值判断这一对关联是否成立。本发明能够使得在没有人工干预的情况下,较快速地给出药物‑靶向蛋白可能的相互作用对,从而节省药物研发试验成本,加快了药物新功能的挖掘和发现。
-
公开(公告)号:CN107894974A
公开(公告)日:2018-04-10
申请号:CN201711061497.8
申请日:2017-11-02
Applicant: 华南农业大学
Abstract: 本发明公开了一种基于标签路径和文本标点比特征融合的网页正文提取方法,主要通过构造标签路径的文本标点比和特征融合方法,提出一种新的特征值,从而将正文从网页中提取出来。本发明的特色在于定义了文本标点比特征对衡量标签路径的平均句子长度,同时结合了标签路径的位置及其内部复杂度,给出了一个较全面的特征值去判断正文内容。使用本发明可以不需要构造提取模版较精确地提取网页正文,同时适用范围广。
-