标注数据的处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111046927A

    公开(公告)日:2020-04-21

    申请号:CN201911177127.X

    申请日:2019-11-26

    Abstract: 本公开关于标注数据的处理方法、装置、电子设备及存储介质,包括:获取标注数据集和标注标签集;所述标注标签集包括候选标注标签,所述标注数据集包括由标注用户基于候选标注标签设置标注标签后的标注数据,所述候选标注标签具有对应的类别;获取所述标注数据的标注特征;采用在同一类别的所述候选标注标签计算标签特征,并采用所述标签特征计算所述同一类别的标签中心特征;计算在同一类别的所述标注特征和所述标签中心特征之间的距离;根据所述距离确定处于异常标注用户;删除在所述标注数据集中所述异常标注用户对应的标注数据。本实施例根据距离确定的异常标注用户,删除该标注用户的标注数据,使得用于训练模型的标注数据更加精确。

Patent Agency Ranking