一种基于非负矩阵分解的质谱数据缺失值填补方法及系统

    公开(公告)号:CN111859275B

    公开(公告)日:2022-08-12

    申请号:CN202010701528.7

    申请日:2020-07-20

    Applicant: 厦门大学

    Abstract: 本发明涉及一种基于非负矩阵分解的质谱数据缺失值填补方法及系统,包括:对数据集矩阵进行缺失值的预填补,得到无缺失的初始数据矩阵;对无缺失的初始数据矩阵中所有元素进行对数变换;取一组非负矩阵分解的维度参数,分别进行非负矩阵分解,得到对应的一组重构矩阵;对重构矩阵的元素值做指数变换;计算所有指数变换后的重构矩阵与无缺失的初始数据矩阵之间的重构误差;根据重构误差计算得到不同重构矩阵下各自对应的权重;对重构矩阵进行加权平均,得到加权重构矩阵;将加权重构矩阵中对应位置的元素值填补到数据集矩阵中的缺失位置;基于无缺失的最终数据矩阵进行特征代谢物识别及通路分析。本发明的上述方法能够提高数据填补精度。

    一种基于非负矩阵分解的质谱数据缺失值填补方法及系统

    公开(公告)号:CN111859275A

    公开(公告)日:2020-10-30

    申请号:CN202010701528.7

    申请日:2020-07-20

    Applicant: 厦门大学

    Abstract: 本发明涉及一种基于非负矩阵分解的质谱数据缺失值填补方法及系统,包括:对数据集矩阵进行缺失值的预填补,得到无缺失的初始数据矩阵;对无缺失的初始数据矩阵中所有元素进行对数变换;取一组非负矩阵分解的维度参数,分别进行非负矩阵分解,得到对应的一组重构矩阵;对重构矩阵的元素值做指数变换;计算所有指数变换后的重构矩阵与无缺失的初始数据矩阵之间的重构误差;根据重构误差计算得到不同重构矩阵下各自对应的权重;对重构矩阵进行加权平均,得到加权重构矩阵;将加权重构矩阵中对应位置的元素值填补到数据集矩阵中的缺失位置;基于无缺失的最终数据矩阵进行特征代谢物识别及通路分析。本发明的上述方法能够提高数据填补精度。

Patent Agency Ranking