一种基于深度学习的mRNA领域文献挖掘系统

    公开(公告)号:CN119990143A

    公开(公告)日:2025-05-13

    申请号:CN202510464941.9

    申请日:2025-04-15

    Abstract: 本发明提供了一种基于深度学习的mRNA领域文献挖掘系统,涉及生物信息学与自然语言处理的技术领域,能够有效识别与mRNA相关的实体包括基因、蛋白质、疾病等及其语义关系;本发明系统结合了最新的BioBERT模型和Transformer‑CRF模型,通过多任务学习架构实现命名实体识别和关系提取的高效协同优化,显著提升了mRNA领域文献挖掘的精度与效率;能够有效处理生物医学领域特有的术语和复杂句法结构,并通过多任务优化减少冗余、提升整体性能;通过融合BioBERT的预训练知识与Transformer‑CRF的序列标注能力,为mRNA相关文献的深度挖掘与知识发现提供了创新的技术支持,具有广泛的应用前景。

    一种植物表型多组学预测方法及系统

    公开(公告)号:CN118983005A

    公开(公告)日:2024-11-19

    申请号:CN202411063176.1

    申请日:2024-08-05

    Abstract: 本发明公开了一种植物表型多组学预测方法,包括:构建包括转录组预测模块、第一输出模块、基因组预测模块、第二输出模块和综合训练模块的多组学表型预测模型;获取植物的SNP数据和基因表达数据并进行预处理,对应得到SNP特征和基因表达特征;将基因表达特征输入至转录组预测模块,得到转录组数据特征;将转录组数据特征输入至第一输出模块,得到第一预测表型;将SNP特征输入至基因组预测模块,得到基因组数据特征;将基因组数据特征输入至第二输出模块,得到第二预测表型;将转录组数据特征和基因组数据特征连接后输入至综合训练模块,得到第三预测表型。结合基因网络和深度学习的方法有望克服现有方法的局限,进一步提升植物表型预测精度。

    一种基于重测序的InDel背景分子标记设计方法及应用

    公开(公告)号:CN118116451A

    公开(公告)日:2024-05-31

    申请号:CN202410286173.8

    申请日:2024-03-13

    Abstract: 本发明公开了一种基于重测序的InDel背景分子标记设计方法及应用,包括数据预处理模块、变异位点筛选模块、引物设计模块和背景分子标记开发模块。本发明实现了基于重测序数据,在全基因组范围内鉴定和筛选InDe l标记,并进行引物设计和背景分子标记开发,具有操作灵活、自动化程度高和批量高效等优点。本发明基于样本的重测序数据设计背景分子标记,与传统的基于参考基因组设计引物相比,引物特异性更强、密度更高、数量更多。本发明创新性使用划窗对InDel变异进行筛选,统一了每个窗口只允许存在一个InDel标记,减少了基于参考基因组直接寻找变异位点的不确定性,保证了背景分子标记的可靠性和基因分型能力。

    与作物种子胚乳合成茶氨酸相关的基因及应用

    公开(公告)号:CN117802125A

    公开(公告)日:2024-04-02

    申请号:CN202311847754.6

    申请日:2023-12-29

    Abstract: 本发明公开了与作物种子胚乳合成茶氨酸相关的基因及应用,属于基因工程领域。本发明根据育种作物的密码子偏好性,优化AlaDC和TS的基因序列,利用连接肽连接两个基因片段后获得融合基因I,与育种作物胚乳强表达启动子融合,构建基因表达盒I;将AlaAT与育种作物胚乳强表达启动子融合,构建基因表达盒II;将基因表达盒I和基因表达盒II转入表达载体构建多基因重组载体;将多基因重组载体导入育种作物,获得种子胚乳能合成茶氨酸的转基因作物。本发明实现茶氨酸在作物(尤其是水稻)种子胚乳中的合成,其产品即可以直接用于食用,也可以作为生产茶氨酸的原料,对于新型功能性作物育种具有重要的指导意义和生产应用价值。

    一种水稻病叶严重程度估计方法及系统

    公开(公告)号:CN118823521A

    公开(公告)日:2024-10-22

    申请号:CN202410973180.5

    申请日:2024-07-19

    Abstract: 本发明公开了一种水稻病叶严重程度估计方法及系统,属于水稻病害评估技术领域。方法主要包括:采用MobileNetV3作为主干网络,并基于多尺度全局特征提取和注意力机制构建水稻病叶严重程度估计模型;对构建的水稻病叶严重程度估计模型进行训练;利用训练好的水稻病叶严重程度估计模型进行水稻病叶严重程度估计。本发明采用改进的MobileNetV3作为主干网络,快速高效地提取疾病特征,同时采用多尺度全局特征提取方式提取水稻病叶上不同大小的病害信息,接着采用增强通道注意力机制对不同尺度的特征图生成注意力权值,重点关注不同大小的病害区域,从而高效准确的完成对水稻病叶不同严重程度级别的识别。

    与作物种子胚乳合成茶氨酸相关的基因及应用

    公开(公告)号:CN117802125B

    公开(公告)日:2024-06-18

    申请号:CN202311847754.6

    申请日:2023-12-29

    Abstract: 本发明公开了与作物种子胚乳合成茶氨酸相关的基因及应用,属于基因工程领域。本发明根据育种作物的密码子偏好性,优化AlaDC和TS的基因序列,利用连接肽连接两个基因片段后获得融合基因I,与育种作物胚乳强表达启动子融合,构建基因表达盒I;将AlaAT与育种作物胚乳强表达启动子融合,构建基因表达盒II;将基因表达盒I和基因表达盒II转入表达载体构建多基因重组载体;将多基因重组载体导入育种作物,获得种子胚乳能合成茶氨酸的转基因作物。本发明实现茶氨酸在作物(尤其是水稻)种子胚乳中的合成,其产品即可以直接用于食用,也可以作为生产茶氨酸的原料,对于新型功能性作物育种具有重要的指导意义和生产应用价值。

    一种基于重测序的InDel背景分子标记设计方法及应用

    公开(公告)号:CN118116451B

    公开(公告)日:2025-01-07

    申请号:CN202410286173.8

    申请日:2024-03-13

    Abstract: 本发明公开了一种基于重测序的InDel背景分子标记设计方法及应用,包括数据预处理模块、变异位点筛选模块、引物设计模块和背景分子标记开发模块。本发明实现了基于重测序数据,在全基因组范围内鉴定和筛选InDe l标记,并进行引物设计和背景分子标记开发,具有操作灵活、自动化程度高和批量高效等优点。本发明基于样本的重测序数据设计背景分子标记,与传统的基于参考基因组设计引物相比,引物特异性更强、密度更高、数量更多。本发明创新性使用划窗对InDel变异进行筛选,统一了每个窗口只允许存在一个InDel标记,减少了基于参考基因组直接寻找变异位点的不确定性,保证了背景分子标记的可靠性和基因分型能力。

Patent Agency Ranking