-
公开(公告)号:CN113764031A
公开(公告)日:2021-12-07
申请号:CN202111089684.3
申请日:2021-09-16
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种跨组织/物种RNA序列中N6甲基腺苷(m6A)位点的预测方法,步骤为:获取跨物种/组织的正样本序列和等量的负样本序列;使用STREME方法进行motif挖掘;使用启发自NLP的ELMo方法进行特征编码;构建预测模型,输入数据获得初步预测结果;调整训练后预测模型中的参数,对训练后的预测模型进行优化;使用IG方法对模型进行可解释性分析;使用5折交叉验证和独立测试评估预测模型。该方法使用ELMo进行特征编码,无需利用生物学先验知识,利用深度网络挖掘序列深层信息,提高了预测m6A修饰位点的准确率。
-
公开(公告)号:CN112508958A
公开(公告)日:2021-03-16
申请号:CN202011480237.6
申请日:2020-12-16
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种轻量多尺度的生物医学图像分割方法,包括如下步骤:1)获取公共的生物医学图像数据集;2)数据预处理;3)构建模型4)特征提取;5)模型训练;6)模型评估。这种分割方法可以多尺度提取生物医学图像中的特征,还减少了计算时间,避免出现特征信息重叠和冗余,同时还可以保证甚至提高模型的分割精度。
-
-
公开(公告)号:CN107742063A
公开(公告)日:2018-02-27
申请号:CN201710999198.2
申请日:2017-10-20
Applicant: 桂林电子科技大学
CPC classification number: G06F19/22 , G06F19/24 , G06K9/6257 , G06K9/6269
Abstract: 本发明公民公开了一种原核生物σ54启动子的预测方法,其特征在于,包括如下步骤:1)数据样本编码;2)特征选择;3)构造预测模型;4)获取一级序列信息;5)待预测基因序列编码;6)预测。这种方法预测速度快、精度高。
-
公开(公告)号:CN104089911B
公开(公告)日:2016-05-25
申请号:CN201410299422.3
申请日:2014-06-27
Applicant: 桂林电子科技大学
IPC: G01N21/31 , G01N21/359
Abstract: 本发明为基于一元线性回归的光谱模型传递方法,主要步骤Ⅰ对M台光谱仪器的样品光谱进行相同预处理;Ⅱ根据样品的m种成分将光谱数据分为m个校正集和预测集,分别在M台仪器上建立m个校正模型;Ⅲ校正模型评价;Ⅳ将预测效果最好的仪器作为主仪器,其它为从仪器;Ⅴ选取主仪器校正集中针对各从仪器的最佳样品,按其序号确定各从仪器转换集样品,用一元线性回归求回归系数,校正从仪器光谱,然后代入主仪器校正模型得样品成分含量结果。本方法有效消除不同光谱仪器的差异,实现主仪器上建立的校正模型能够在多台从仪器上共享,减少了分析测试工作量,节约模型建立的成本;且所求参数少、模型简单,预测准确度更高。
-
公开(公告)号:CN119811504A
公开(公告)日:2025-04-11
申请号:CN202411931012.6
申请日:2024-12-26
Applicant: 桂林电子科技大学
IPC: G16B40/00 , G16B5/00 , G16B30/00 , G06N3/0455 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种识别DNA序列中超级增强子与典型增强子的预测方法,采用整数编码和k‑mer编码方案进行编码,使用残差连接的卷积神经网络提取序列的局部特征,使用两个双向长短期记忆网络提取序列的多尺度全局特征。利用注意力机制将这些局部特征和全局特征进行特征融合,然后输入到全连接神经网络中得到预测概率。采用五折交叉验证的评估方式对模型性能进行评估,使用准确率(ACC)、召回率(REC)、精度(PRE)、F1分数(F1)、ROC曲线下面积(AUC)等五个评估指标衡量模型;独立测试集上的实验结果表明,相比于最先进的方法,我们的模型在识别超级增强子与典型增强子上有了显著的性能提升。
-
公开(公告)号:CN118098572A
公开(公告)日:2024-05-28
申请号:CN202410324041.X
申请日:2024-03-21
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种根据血液检测结果诊断患者肝纤维化分期状态的可解释OPTUNADF检测方法,获取肝纤维化患者的血液检测结果以及肝纤维化诊断状况;对特征进行标准化,并对异常值进行处理,使用数据均衡策略,获得均衡化后的数据集,使用前向特征选择筛选最相关特征子集;使用级联森林模型深度森林(DF)对数据集进行预测;使用OPTUNA超参数优化框架对模型进行处理;迭代100次,选择精度最优的超参数并输出OPTUNADF的预测结果;采用五折交叉验证的评估方式对模型性能进行评估,使用ROC、准确率、精确度、F1‑score、召回率五个评估指标衡量模型;使用SHAP中的kernelExplainer构建模型解释器对步骤5)中选取出的模型进行全局解释和局部解释。该方法无需侵入性检测,通过非侵入性的血液检测就可以诊断患者肝纤维化状态,同时兼具可解释性,相比于最先进的方法具有更优越的识别性能且预测过程更加透明。
-
公开(公告)号:CN117672367A
公开(公告)日:2024-03-08
申请号:CN202311297790.X
申请日:2023-10-09
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种环状RNA亚细胞定位的预测方法,其特征包含如下步骤:获取含有携带亚细胞定位信息的环状RNA序列;使用CD‑HIT软件去除相似度超过80%的同源性序列;使用8‑mer划分RNA序列并计算每个短序列出现的频率特征,根据RNA二核苷酸物理化学性质计算自协方差与交叉协方差组成DACC特征;使用工具提取RNA序列的数学统计特征;使用IFS方法对8‑mer特征进行第一次特征选择,经过筛选的特征与DACC特征、数学特征进行融合,然后使用RFE方法进行第二次特征选择;将特征选择后的特征集输入到岭回归模型得到预测结果;采用十折交叉验证的评估方式对模型性能进行评估。该方法可以仅通过数学手段提取RNA序列中的特征,与基于生物学知识提取的序列特征相结合可以显著提高模型预测的能力。
-
公开(公告)号:CN116312775A
公开(公告)日:2023-06-23
申请号:CN202310155459.8
申请日:2023-02-23
Applicant: 桂林电子科技大学
IPC: G16B20/40 , G16B30/00 , G16B40/00 , G06N3/0442 , G06N3/0464 , G06N3/045 , G06N3/08
Abstract: 本发明公开了一种与自闭症谱系障碍症(ASD)相关RNA序列的预测方法,步骤为:获取与ASD相关编码蛋白转录RNA序列的正样本、负样本,以及相关序列在人类大脑中的基因表达值;使用k‑mer对相关RNA序列进行特征提取,使得每一条序列由一个长度为4k的向量表示;将序列的特征编码与对应的表达值进行特征融合后归一化处理,之后利用卡方检验得到特征子集,并使用逻辑回归得到最终要输入模型的数据;构建预测模型,输入数据获得初步预测结果;调整训练后预测模型中的参数,对训练后的预测模型进行优化;使用10折交叉验证评估预测模型。实验结果表明,与现有方法相比,我们的结果在各个评估指标都有显着的性能提升,提高了预测与ASD相关RNA序列准确率。
-
公开(公告)号:CN112508958B
公开(公告)日:2022-07-19
申请号:CN202011480237.6
申请日:2020-12-16
Applicant: 桂林电子科技大学
Abstract: 本发明公开了一种轻量多尺度的生物医学图像分割方法,包括如下步骤:1)获取公共的生物医学图像数据集;2)数据预处理;3)构建模型4)特征提取;5)模型训练;6)模型评估。这种分割方法可以多尺度提取生物医学图像中的特征,还减少了计算时间,避免出现特征信息重叠和冗余,同时还可以保证甚至提高模型的分割精度。
-
-
-
-
-
-
-
-
-