一种数据抽样的方法和设备
    1.
    发明公开

    公开(公告)号:CN116861228A

    公开(公告)日:2023-10-10

    申请号:CN202210300944.5

    申请日:2022-03-25

    Abstract: 本申请公开了一种数据抽样的方法和设备,用于对数据集中数据进行分类并选取代表性样本。本申请实施例方法包括:获取数据集,数据集中的每个数据携带至少一个标签;根据数据携带的至少一个标签将数据添加至至少一个标签对应的数据子集;选取数据集的代表性样本,数据集的代表性样本为数据子集的数据。通过获取多个携带标签的数据组合成的数据集和标签集,根据数据携带的标签将数据进行分类,获得多个数据子集,从这些数据子集中选择数据,获得数据集的代表性样本。保证了代表性样本覆盖了数据集中的各类数据,以确保用户在查阅数据集的代表性样本时,可以全面的了解数据集中数据的种类。

Patent Agency Ranking