-
公开(公告)号:CN119724349A
公开(公告)日:2025-03-28
申请号:CN202510228817.2
申请日:2025-02-28
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B30/00 , G16B40/00 , G06N3/045 , G06N3/0464 , G06N3/048 , G06N3/0499 , G06N3/0455 , G06N3/082 , G06N3/084 , G06N3/0985
Abstract: 本发明公开了一种基于预训练模型和RNA二级结构的RNA G‑四链体预测方法和系统,包括,获取人类rG4在人类转录本上的位置信息;对于每一条序列,根据其序列位置坐标向两侧进行相同长度的填充使总长度达到设定长度值;获取人类cDNA序列数据作为参考序列,根据填充后的序列坐标从cDNA序列中提取包含侧翼序列信息的rG4数据作为正样本序列;对每条正样本序列进行打乱得到负样本序列;生成每条样本序列的RNA二级结构特征;使用预训练模型提取样本序列的序列特征;将序列特征和RNA二级结构特征输入至预测模型进行模型训练。本方案利用RNA序列的二级结构特征,引入二级结构特征作为辅助信息,能够显著提升模型的预测性能。
-
公开(公告)号:CN118861748A
公开(公告)日:2024-10-29
申请号:CN202410806316.3
申请日:2024-06-21
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明提供了一种基于多核和标签松弛的药物副作用识别方法及其系统,包括,根据药物核集合和副作用核集合得到一组pairwise核;构建包含多个pairwise核的目标函数,目标函数包括每个pairwise核的自适应权重;且目标函数包括松弛标签矩阵;通过迭代算法优化目标函数的每个待解参数,包括松弛标签矩阵E,第v个pairwise核的参数向量αv,第v个pairwise核的权重βv,v=1...V,V表示pairwise核的数量,本方案采用基于多核的药物副作用是被方法,并且在预测结果的层面进行融合,对每个视角都学习到参数α,对不同视图进行单独灵活的建模,能够灵活地捕捉不同数据视图的特征,而且首次将标签松弛方法引入药物副作用识别问题,通过标签松弛矩阵来宽松原本的二元矩阵,使学习参数更具判别力,进一步提升识别性能。
-
公开(公告)号:CN118212983B
公开(公告)日:2024-09-20
申请号:CN202410638063.3
申请日:2024-05-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/30 , G16B40/00 , G16B30/10 , G06N3/0464 , G06N3/0455 , G06F18/24 , G06F18/27
Abstract: 本发明属于于计算生物学技术领域,具体涉及一种结合神经网络模型的核酸修饰位点识别方法。该包括处理核酸序列数据和搭建神经网络模型,所述处理核酸序列数据包括数据收集和预处理,通过偏序比对获得支持序列,通过多序列比对生成路径矩阵,最终得到每个样本对应的路径矩阵;所述搭建神经网络模型包括神经网络模型设计,该神经网络模型架构包括编码器、卷积神经网络和展平向量,路径矩阵通过神经网络模型最终得到输出值,通过该输出值判断样本序列中是否存在核酸修饰位点。本发明的技术方案利用先进的比对技术和深度学习方法,提高了核酸修饰位点识别的准确性和效率。
-
公开(公告)号:CN118212983A
公开(公告)日:2024-06-18
申请号:CN202410638063.3
申请日:2024-05-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/30 , G16B40/00 , G16B30/10 , G06N3/0464 , G06N3/0455 , G06F18/24 , G06F18/27
Abstract: 本发明属于于计算生物学技术领域,具体涉及一种结合神经网络模型的核酸修饰位点识别方法。该包括处理核酸序列数据和搭建神经网络模型,所述处理核酸序列数据包括数据收集和预处理,通过偏序比对获得支持序列,通过多序列比对生成路径矩阵,最终得到每个样本对应的路径矩阵;所述搭建神经网络模型包括神经网络模型设计,该神经网络模型架构包括编码器、卷积神经网络和展平向量,路径矩阵通过神经网络模型最终得到输出值,通过该输出值判断样本序列中是否存在核酸修饰位点。本发明的技术方案利用先进的比对技术和深度学习方法,提高了核酸修饰位点识别的准确性和效率。
-
公开(公告)号:CN118039024A
公开(公告)日:2024-05-14
申请号:CN202410164116.2
申请日:2024-02-05
Applicant: 电子科技大学长三角研究院(衢州)
Abstract: 本发明属于生物医学信息技术领域,具体涉及一种基于多空间映射的药物与疾病关联预测系统、设备及介质。为了解决因此现有的药物与疾病关联预测系统因为无法进行多空间的联合可视化映射从而存在潜在的疾病‑药物关联预测准确率低的问题,提供了基于多空间映射的药物与疾病关联预测系统,可以更好的利用原始空间内的结构信息和多空间之间的关联信息,可以有效的补全并构建全连接模型,以获得更好的关联预测结果,因此解决了现有的药物与疾病关联预测系统因为无法进行多空间的联合可视化映射从而存在潜在的疾病‑药物关联预测准确率低的问题。
-
公开(公告)号:CN118021258A
公开(公告)日:2024-05-14
申请号:CN202410164113.9
申请日:2024-02-05
Applicant: 电子科技大学长三角研究院(衢州)
IPC: A61B5/00 , G16H50/20 , G16H50/70 , G06T7/00 , G06F18/2411 , G06N20/10 , A61B5/055 , G06F123/02
Abstract: 本发明属于生物医学信息技术领域,具体涉及一种基于功能性磁共振成像的自闭症识别系统。本发明针对现有分析系统中存在缺乏局部关联信息、异步关联信息导致分析系统识别自闭症谱系障碍疾病的准确率低的问题;本发明从概率分布的角度,充分统计了原始图像数据的上下文信息,同异步关联信息等,能有效、准确地分析精神类疾病患者在功能性磁共振成像中的差异及病理变化;采用多尺度多变量的方式计算时间序列之间的相互关系,能够更好的挖掘其内在的相关性;本专利充分考虑了时间序列之间异步性和局部性的特点,模型方法有效统计并计算了两个时间序列之间的异步关联性和局部特异性,可以更好的识别自闭症。
-
公开(公告)号:CN117577184A
公开(公告)日:2024-02-20
申请号:CN202311453295.3
申请日:2023-11-02
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B30/00
Abstract: 本方案公开了一种可用于大规模基因组的多基因组比对方法,属于计算机生物学技术领域,提出BWT‑FM‑LIS循环分治的方式检索全基因组间公共子串,尽可能多地检索出基因组间的公共子串和关键路径,缩短需动态规划对齐的差异子字符串长度,进而降低比对的复杂度以使本方案可用于大规模大基因组的比对,适用于大规模长序列或超长基因组数据,可以识别出基因组比对中多种结构变异。
-
公开(公告)号:CN116343917B
公开(公告)日:2023-11-10
申请号:CN202310326955.5
申请日:2023-03-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/30
Abstract: 本方案公开了一种基于ATAC‑seq足迹识别转录因子共定位的方法,首先根据ATAC‑seq数据,使用HINT‑ATAC方法进行数据预处理,然后基于泊松分布构建识别转录因子共定位模型,基于距离ds实现协同结合和竞争结合的转录因子对的识别,通过仅使用ATAC‑seq数据作为输入,就能识别协同结合和竞争结合的转录因子对,为进一步应用于多个细胞系提供基础。
-
公开(公告)号:CN116343917A
公开(公告)日:2023-06-27
申请号:CN202310326955.5
申请日:2023-03-22
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B20/30
Abstract: 本方案公开了一种基于ATAC‑seq足迹识别转录因子共定位的方法,首先根据ATAC‑seq数据,使用HINT‑ATAC方法进行数据预处理,然后基于泊松分布构建识别转录因子共定位模型,基于距离ds实现协同结合和竞争结合的转录因子对的识别,通过仅使用ATAC‑seq数据作为输入,就能识别协同结合和竞争结合的转录因子对,为进一步应用于多个细胞系提供基础。
-
公开(公告)号:CN120048352A
公开(公告)日:2025-05-27
申请号:CN202510510719.8
申请日:2025-04-23
Applicant: 电子科技大学长三角研究院(衢州)
IPC: G16B30/00 , G16B40/00 , G06N3/0475 , G06N3/0455 , G06N3/0985 , G06N3/0464 , G06N3/084
Abstract: 本发明涉及一种基于潜在扩散模型的酵母菌核心启动子序列生成方法。它解决了现有技术中启动子序列生成方法训练不稳定、生成的样本质量低、计算成本高的问题。它包括S1、数据收集与预处理;S2、序列编码;S3、构建潜在扩散模型;S4、模型训练;S5、生成新的启动子序列;S6、生成序列同原自然序列的对比。本发明的优点在于:通过用现有酵母菌核心启动子序列数据集训练一个基于深度学习的潜在扩散模型,使模型学习并具有生成新酵母菌核心启动子的能力,并生成高质量的、多样化的酵母菌核心启动子序列,克服了传统的方法,计算成本高,生成速度慢,生成样本质量差等问题。降低了酵母菌启动子生物实验成本,加速研究进程,推动酵母菌的工业发酵优化。
-
-
-
-
-
-
-
-
-