一种基于掩码语言模型的基因型补全方法及相关设备

    公开(公告)号:CN117594123A

    公开(公告)日:2024-02-23

    申请号:CN202311531832.1

    申请日:2023-11-15

    Inventor: 陈俊杰 梁世琦

    Abstract: 本发明公开了一种基于掩码语言模型的基因型补全方法及相关设备,所述方法包括:获取全基因组单倍体缺失序列以及对应的染色体位置序列,并对全基因组单倍体缺失序列进行映射处理,得到模型输入序列;根据模型输入序列和染色体位置序列对掩码语言模型进行训练和优化,得到基因型补全模型;获取目标全基因组单倍体缺失序列,并输入至基因型补全模型,得到目标缺失基因,并根据目标缺失基因对目标全基因组单倍体缺失序列中的缺失点位进行补全,得到补全后完整的基因序列。本发明能够提高全基因组单倍体序列,特别是低频率等位基因中缺失位点的基因补全准确度,同时也能够提升其基因补全效率。

    基于域约束和课程学习反馈的数据生成方法及相关设备

    公开(公告)号:CN117421599A

    公开(公告)日:2024-01-19

    申请号:CN202311477473.6

    申请日:2023-11-06

    Abstract: 本发明公开一种基于域约束和课程学习反馈的数据生成方法及相关设备,所述方法包括步骤:对生成模型进行第一阶段训练得到目标生成模型;对所述目标生成模型进行第二阶段训练得到最终生成模型,第二阶段训练中,每生成设定数量的生成样本,则对生成样本进行域判定,若生成样本与真实样本的域距离大于设定域距离,则丢弃生成样本,若生成样本与真实样本的域距离小于设定域距离,则根据属性评估器对生成样本进行筛选,根据通过筛选的生成样本对真实样本进行反馈;根据最终生成模型生成所需输出样本。本发明通过计算生成样本与真实样本的域差距,丢弃远离真实样本的生成样本,从而在反馈机制的基础上添加域约束,降低属性评估器带来的误差。

    一种资源化处理畜禽养殖沼液的方法

    公开(公告)号:CN112694215B

    公开(公告)日:2021-09-14

    申请号:CN202011405037.4

    申请日:2020-12-04

    Abstract: 本发明公开了一种资源化处理畜禽养殖沼液的方法,属于畜禽养殖沼液资源化处理技术领域。本发明解决了现有沼液处理过程中资源利用不彻底,造成的资源浪费甚至环境污染等问题。本发明针对执行《畜禽养殖业污染物排放标准》(GB 18596‑2001)和《污水综合排放标准》(GB 8978‑1996)表4中的一级标准的集约化畜禽养殖场和养殖区分别提出了“MAP‑AnFMBR‑SBR‑混凝”和“MAP‑AnFMBR‑SBR‑臭氧氧化”组合工艺,可以在高效处理、稳定达标的同时回收沼液中的氮、磷资源和有机质能源,实现了沼液资源化和能源化处理,具有较好的应用前景。

    一种生活污水污泥同步生态处理一体化设备及处理方法

    公开(公告)号:CN114988632B

    公开(公告)日:2023-01-20

    申请号:CN202210380178.8

    申请日:2022-04-12

    Abstract: 一种生活污水污泥同步生态处理一体化设备及处理方法,它涉及污水处理设备技术领域,本发明要解决一体化污水处理设备在应用中存在功能件较多、能耗高、运行维护成本高、操作难度大的问题。本发明一体式箱形主体内设有隔成厌氧池、污泥减量与反硝化池、好氧池、沉淀池和消毒池,并相互连通,污泥减量与反硝化池内部下方铺设可变微孔曝气管,蠕虫填料和多功能水质在线检测仪,好氧池内部下方设有曝气管道组件,DO在线检测仪。本发明一体化设备的水处理工艺具有抗冲击负荷强、运行稳定可靠、同步污水反硝化脱氮与污泥减量效果显著及生态效益显著等优点,总氮去除率高达85%以上,污泥同步减量效果可达60%以上。本发明应用于污水污泥处理领域。

    一种资源化处理畜禽养殖沼液的方法

    公开(公告)号:CN112694215A

    公开(公告)日:2021-04-23

    申请号:CN202011405037.4

    申请日:2020-12-04

    Abstract: 本发明公开了一种资源化处理畜禽养殖沼液的方法,属于畜禽养殖沼液资源化处理技术领域。本发明解决了现有沼液处理过程中资源利用不彻底,造成的资源浪费甚至环境污染等问题。本发明针对执行《畜禽养殖业污染物排放标准》(GB 18596‑2001)和《污水综合排放标准》(GB 8978‑1996)表4中的一级标准的集约化畜禽养殖场和养殖区分别提出了“MAP‑AnFMBR‑SBR‑混凝”和“MAP‑AnFMBR‑SBR‑臭氧氧化”组合工艺,可以在高效处理、稳定达标的同时回收沼液中的氮、磷资源和有机质能源,实现了沼液资源化和能源化处理,具有较好的应用前景。

    基于序列依赖频率矩阵的生物序列进化信息提取方法

    公开(公告)号:CN106529212B

    公开(公告)日:2019-01-25

    申请号:CN201610911060.8

    申请日:2016-10-19

    Abstract: 本发明提供了种基于序列依赖频率矩阵的生物序列进化信息提取方法,其采用序列依赖频率矩阵SDFM进行生物序列进化信息提取,所述SDFM采用以下步骤获得:对于任意的生物序列,首先利用序列比对工具搜索对应的生物序列数据库,生成对应的多序列比对MSA;然后统计在多序列比对MSA中每个位点生物序列子串出现的频率,得到如式(1)所示的序列依赖频率矩阵SDFM。本发明的技术方案考虑到了生物序列中相邻位点的依赖关系,能够从多序列比对中提取出更多、更准确的功能、结构等生物序列进化特征,使得统计的概率分布信息包含了序列位点依赖关系信息。

    蛋白质远程同源性检测方法及装置

    公开(公告)号:CN104636636B

    公开(公告)日:2018-01-05

    申请号:CN201510057034.9

    申请日:2015-02-02

    Abstract: 本发明涉及蛋白质远程同源性检测方法及装置,包括训练过程和检测过程;训练过程包括将样本蛋白质作为查询序列输入一组基于排序策略的蛋白质同源性检测的基排序,并在数据库中进行检索,每一个检索结果对应一个同源相似性评分,将所有检索结果降序排序,并组合成特征向量,将得到的特征向量输入基于排序学习的方法中进行训练,得到排序模型;检测过程包括将目标蛋白质按照类似训练过程的方式得到特征向量,输入训练好的排序模型进行排序,得到排序结果,根据排序结果确定目标蛋白质的远程同源性检测结果。本发明通过组合多个基排序的检测结果作为特征向量,然后采用排序学习方法进行训练得到排序模型,从而可以有效提高检测的准确性和稳定性。

Patent Agency Ranking