-
公开(公告)号:CN119380825A
公开(公告)日:2025-01-28
申请号:CN202411647402.0
申请日:2024-11-18
Applicant: 哈尔滨工业大学
IPC: G16B40/00 , G16B5/00 , G06F18/2113 , G06F18/213 , G06F18/2411 , G06F18/2415 , G06F18/243 , G06N20/00
Abstract: 一种多尺度特征增强与特征选择的代谢产物预测方法,涉及代谢产物预测领域。本发明是为了解决现有代谢产物预测准确率低的问题。本发明包括:对每个生物样本的质谱数据特征向量进行预处理,获得多尺度特征矩阵;利用多尺度特征矩阵,获取每个特征对于代谢类别的信息增益;根据每个特征对于代谢物预测的信息增益对多尺度特征矩阵中的特征进行筛选,获得最终特征集。利用最终特征集及对应代谢物标签训练ANN模型,获得代谢产物预测模型;获取待预测生物样本的最终特征集合,将待预测生物样本的最终特征集合输入到代谢产物预测模型中,获得待预测生物样本的代谢产物类别。本发明用于预测生物的代谢产物类别。
-
公开(公告)号:CN119763659A
公开(公告)日:2025-04-04
申请号:CN202411842257.1
申请日:2024-12-13
Applicant: 哈尔滨工业大学
Abstract: 一种基于家系基因组数据的存储与可视化检索方法及系统,涉及分子生物学技术领域,针对现有家系基因组数据的存储与检索方法存储效率和检索效率低的问题,本申请将家系基因组数据中的基因序列、碱基变异、变异位点信息和家系关系进行有机整合,并通过将编码后的向量与原始数据建立联合索引进行存储,而检索时,则通过余弦相似度确定基因序列或碱基序列,进而得到变异位点信息。本申请的技术方案可以提升存储效率和检索效率。
-