一种基于多模态Agent的图像分类数据构建方法

    公开(公告)号:CN119992195A

    公开(公告)日:2025-05-13

    申请号:CN202510082819.5

    申请日:2025-01-20

    Abstract: 本发明公开了一种基于多模态Agent的图像分类数据构建方法,包括以下步骤:输入图像、数据集信息:包括:1)从多种渠道收集的图像数据、照片及视频格式,连同预期的图像分类数据集的详细信息;2)直接输入数据集名称;Agent将执行在线搜索并整合预训练的模型数据以检索相关的数据集信息;用户根据提示输入其需求后,Agent开始与大模型互动,使模型能够利用提供的操作制定满足用户需求的计划,并将根据制定的计划自动调用操作,完成指定任务。本发明实现了图像分类数据集扩展和创建的全自动化和批量处理,显著减少了人力消耗,降低了数据集扩充与创建成本。与传统方法相比提高了操作效率,同时保持了高度的准确性。

Patent Agency Ranking