一种模型训练数据的构建方法及电子设备

    公开(公告)号:CN117951549A

    公开(公告)日:2024-04-30

    申请号:CN202311820850.1

    申请日:2023-12-27

    Abstract: 本申请提供一种模型训练数据的构建方法,包括:根据时序数据,确定突变样本和非突变样本;根据突变区间检测特征,确定所述突变样本的特征和所述非突变样本的特征;对所述突变样本的特征和所述非突变样本的特征进行混合采样聚类,获得模型训练数据。该方案针对突变区间的左右两侧数据存在数据范围上较大变化的特点设计更相关的特征,并提出混合采样聚类优化算法,改善传统过采样算法所带来的样本重叠问题。所构建的模型训练数据能够同时解决少数类样本数量不足和多数类样本冗余问题,使用这些数据所训练得到的模型,其分类性能可大大提升。

Patent Agency Ranking