-
公开(公告)号:CN116226557A
公开(公告)日:2023-06-06
申请号:CN202211726541.3
申请日:2022-12-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9538 , G06F16/957 , G06F16/955 , G06F16/35 , G06F40/295 , G06V10/764
Abstract: 本发明公开一种待标注数据的拾取方法、装置、电子设备和存储介质,涉及数据标注领域。所述方法包括:获取用户所参与的标注任务;基于所述标注任务,为所述用户提供用于固定数据的输入格式;在所述用户正在浏览的页面上,突显所述标注任务下的已采集数据,以得到数据捕获区域;通过用户行为确定所述用户在所述数据捕获区域中捕获的网页区域和内容;基于所述输入格式,将所述网页区域和内容传输给数据标注系统。本发明可以精准完成数据获取和格式校验并同步提交到标注系统,大幅提升标注效率。
-
公开(公告)号:CN116226557B
公开(公告)日:2024-04-19
申请号:CN202211726541.3
申请日:2022-12-29
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9538 , G06F16/957 , G06F16/955 , G06F16/35 , G06F40/295 , G06V10/764
Abstract: 本发明公开一种待标注数据的拾取方法、装置、电子设备和存储介质,涉及数据标注领域。所述方法包括:获取用户所参与的标注任务;基于所述标注任务,为所述用户提供用于固定数据的输入格式;在所述用户正在浏览的页面上,突显所述标注任务下的已采集数据,以得到数据捕获区域;通过用户行为确定所述用户在所述数据捕获区域中捕获的网页区域和内容;基于所述输入格式,将所述网页区域和内容传输给数据标注系统。本发明可以精准完成数据获取和格式校验并同步提交到标注系统,大幅提升标注效率。
-