-
公开(公告)号:CN118470321A
公开(公告)日:2024-08-09
申请号:CN202410643797.0
申请日:2024-05-23
Applicant: 中山大学 , 北京三快在线科技有限公司
IPC: G06V10/26 , G06V20/70 , G06V10/82 , G06N3/092 , G06N3/045 , G06N3/0455 , G06N3/084 , G06N3/0464
Abstract: 本发明公开了一种基于开放上下文场景下自动提示图像分割方法,方法包括:空间感知智能体基于当前状态选择语义开关动作与动作的反馈,经过迭代后推荐最优的提示位置;在SAM模型中使用图像编码器和提示编码器分别对给定的图像和提示集进行编码,获取图像特征和提示特征;将图像特征和提示特征输入掩码解码器,生成分割掩码;利用文本描述引导视觉‑语言模型对给定的图像进行编码,生成激活图;将分割掩码与图像特征进行乘积,获取以空间为主导的状态;将激活图与图像特征进行乘积,获取以语义为主导的状态;将以空间为主导的状态和以语义为主导的状态输入语义校准模块重新校准当前状态。本发明提高了抽象概念的理解能力。
-
公开(公告)号:CN114492602A
公开(公告)日:2022-05-13
申请号:CN202210023563.7
申请日:2022-01-10
Applicant: 北京三快在线科技有限公司
IPC: G06K9/62
Abstract: 本申请提供了一种样本处理方法、装置、电子设备及存储介质,涉及数据处理技术领域,旨在确定无标注样本是分布内样本或者是离群样本。所述方法包括:对样本池中多个无标注样本进行聚类,得到多个无标注样本簇,并确定多个无标注样本簇各自的聚类中心;根据多个有标注样本各自的特征表示,确定多个标注标签各自的特征表示中心;根据多个无标注样本簇各自的聚类中心与多个标注标签各自的特征表示中心的距离,从多个无标注样本簇各自的聚类中心中确定出分布内聚类中心,以及离群聚类中心;将分布内聚类中心对应的无标注样本簇内的各个无标注样本,确定为分布内样本,以及将离群聚类中心对应的无标注样本簇内的各个无标注样本,确定为离群样本。
-
公开(公告)号:CN114419363A
公开(公告)日:2022-04-29
申请号:CN202111591966.3
申请日:2021-12-23
Applicant: 北京三快在线科技有限公司 , 中山大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开了一种基于无标注样本数据的目标分类模型训练方法及装置。其中,该方法包括:基于第一分类模型对样本数据集中的无标注样本集进行标注,以得到伪标签样本集,其中,第一分类模型是基于有标注样本集对目标分类模型训练得到的;根据多模态匹配模型以及伪标签样本集筛除样本数据集中的离群样本,以得到非离群样本集,其中,多模态匹配模型是基于有标注样本集训练得到的;基于非离群样本集对目标分类模型进行训练,直至模型收敛。本发明解决了由于相关技术中半监督学习中有标注数据的稀缺以及离群样本检测准确性差,而导致基于开集半监督学习的模型训练难度大的技术问题。
-
-