预训练方法、装置、计算设备集群、及存储介质

    公开(公告)号:CN117830662A

    公开(公告)日:2024-04-05

    申请号:CN202211179875.3

    申请日:2022-09-27

    Abstract: 本申请涉及人工智能技术领域,公开了一种预训练方法、装置、计算设备集群、及存储介质,该方法包括:将第一图像输入预训练模型得到多个第一像素的特征,其中,第一图像属于多个数据集中的第一数据集,多个数据集与多个标签集一一对应,第一图像包括上述多个第一像素,多个第一像素中的每个第一像素的标签都属于第一数据集对应的标签集,多个标签集中的所有标签分别有一个对应的文本特征;根据上述多个第一像素的特征和多个标签集中的所有标签对应的文本特征更新预训练模型。本申请能够利用多个数据集进行联合预训练,并能自动利用不同数据集的标注之间的联系,从而提升预训练效果。

    一种识别方法、装置及相关设备
    3.
    发明公开

    公开(公告)号:CN117994554A

    公开(公告)日:2024-05-07

    申请号:CN202211350484.3

    申请日:2022-10-31

    Abstract: 本申请提供一种识别方法、装置及相关设备,该方法包括:计算设备将待识别图像输入多个训练好的识别模型,其中,每个训练好的识别模型包括图像语言预训练模型和包括多个提示词的提示模板,各个训练好的识别模型的提示模板各不相同;计算设备基于多个训练好的识别模型确定待识别图像属于各个类别的概率,其中,第i个训练好的识别模型输出待识别图像属于第i个训练好的识别模型对应的多个类别的概率;最后根据待识别图像属于各个类别的概率,确定待识别图像的类别。通过将数据集进行分组,并通过视觉语言预训练模型和提示模板相结合的方式,训练用于未知类检测的模型,能够提高模型对闭集之外的未知类的检测精度,提高模型分类精度。

Patent Agency Ranking