基于自然语言处理的丙二酰化位点预测方法及系统

    公开(公告)号:CN117373536A

    公开(公告)日:2024-01-09

    申请号:CN202311405523.X

    申请日:2023-10-26

    Applicant: 山东大学

    Abstract: 本公开属于生物信息技术领域,提供了一种基于自然语言处理的丙二酰化位点预测方法及系统,包括以下步骤:获取基准数据集;对基准数据集进行平衡处理;将基准数据集分割为多个氨基酸单位,采用Word2vec中的Skip‑gram方法将氨基酸序列从原始空间映射到多维空间;将多维空间特征向量输入CNN预测模型中识别氨基酸序列中丙二酰化位点。本公开使用seqGAN网络进行数据集增强,采用词嵌入技术中的word2vec技术将连续分割后的氨基酸序列映射成高维空间的数字向量,解决了深度网络计算成本大的弊端,提升了丙二酰化位点预测的准确率。

    一种水溶性薄膜及其制备方法与应用

    公开(公告)号:CN113248749A

    公开(公告)日:2021-08-13

    申请号:CN202110413715.X

    申请日:2021-04-16

    Applicant: 山东大学

    Inventor: 李英 张丽娜

    Abstract: 本发明属于日用化学领域,具体涉及一种水溶性薄膜及其制备方法与应用。所述薄膜包括家禽羽毛角蛋白和纤维素。本发明将利用特定方法提取得到的家禽羽毛角蛋白与植物来源的纤维素均匀共混,制备成水溶性薄膜,该薄膜兼具优异的水溶性与良好的力学性能,尤其是在碱性环境下水溶性优异,且成分均为天然物质,安全可靠,且该膜结构相对稳定,不易变形,能够广泛应用于日化品、食品、医药领域。

    一种蛋白质糖化位点鉴定方法

    公开(公告)号:CN110488020A

    公开(公告)日:2019-11-22

    申请号:CN201910734943.X

    申请日:2019-08-09

    Applicant: 山东大学

    Abstract: 本申请提供了一种蛋白质糖化位点鉴定方法,包括:收集蛋白质糖化位点数据,从所述蛋白质糖化位点数据中提取肽链获得肽链样本集,所述肽链以赖氨酸为中心;分别采用单热向量编码所述肽链的每个氨基酸,获得使用单热向量表示的肽链训练集;利用LSTM RNNs训练生产人工肽链样本,构建人工肽链样本集;将所述肽链样本集和人工肽链样本集中各肽链分割成一系列的生物学词,基于所述生物学词分别通过ProtVec构造所述肽链样本集和人工肽链样本集中各肽链的特征;基于CNN训练获得预测器、鉴定蛋白质糖化位点。本申请提供的种蛋白质糖化位点鉴定方法,用于鉴定蛋白质糖化位点,降低特征提取的繁复度,提高蛋白质糖化位点鉴定的准确度。

    一种蛋白质糖化位点鉴定方法

    公开(公告)号:CN109726510A

    公开(公告)日:2019-05-07

    申请号:CN201910061890.X

    申请日:2019-01-23

    Applicant: 山东大学

    Abstract: 本申请提供了一种蛋白质糖化位点鉴定方法,收集糖化位点训练数据集,从所述糖化位点训练数据集中提取肽链,利用肽链数字矢量、肽链中氨基酸的可及表面积、肽链中氨基酸的二级结构概率和肽链的灰色关联度来编码表征蛋白质,选用最大相关性最小冗余(mRMR)特征选择算法找到最佳特征集,然后在支持向量机上训练获得预测器,从而进行蛋白质糖化位点鉴定。本申请提供的蛋白质糖化位点鉴定方法,充分考虑肽链中氨基酸序列、肽链中氨基酸的可及表面积、肽链中氨基酸的二级结构概率和肽链的灰色关联度,有助于提高蛋白质糖化位点鉴定的准确性。

    一种蛋白质糖化位点鉴定方法

    公开(公告)号:CN110488020B

    公开(公告)日:2022-12-13

    申请号:CN201910734943.X

    申请日:2019-08-09

    Applicant: 山东大学

    Abstract: 本申请提供了一种蛋白质糖化位点鉴定方法,包括:收集蛋白质糖化位点数据,从所述蛋白质糖化位点数据中提取肽链获得肽链样本集,所述肽链以赖氨酸为中心;分别采用单热向量编码所述肽链的每个氨基酸,获得使用单热向量表示的肽链训练集;利用LSTM RNNs训练生产人工肽链样本,构建人工肽链样本集;将所述肽链样本集和人工肽链样本集中各肽链分割成一系列的生物学词,基于所述生物学词分别通过ProtVec构造所述肽链样本集和人工肽链样本集中各肽链的特征;基于CNN训练获得预测器、鉴定蛋白质糖化位点。本申请提供的种蛋白质糖化位点鉴定方法,用于鉴定蛋白质糖化位点,降低特征提取的繁复度,提高蛋白质糖化位点鉴定的准确度。

Patent Agency Ranking