-
公开(公告)号:CN117171565A
公开(公告)日:2023-12-05
申请号:CN202311102679.0
申请日:2023-08-30
Applicant: 浙江工商大学
IPC: G06F18/214 , G06F18/24 , G06F18/213 , G06N20/00
Abstract: 本发明公开了一种基于Squared‑chord距离的生物信息标签分布学习方法。本发首先获取生物信息样本数据;其次对获取的生物信息数据划分为训练样本数据和待预测样本数据;然后初始化参数矩阵和迭代更新矩阵,利用Squared‑chord距离和最大熵模型构造目标函数;利用BFGS优化方法优化参数矩阵,直到目标函数的一阶梯度小于预先设定的收敛条件值,得到最佳参数矩阵。最后将待预测生物样本数据输入至优化后的生物信息标签分布学习模型中,由模型预测生物信息样本相关的标签分布。本发明利用Squared‑chord距离最小化预测标签分布与真实标签分布距离的同时,考虑模型的稀疏化,能够有效预测生物信息标签分布。