自监督训练方法及装置
    11.
    发明公开

    公开(公告)号:CN115187826A

    公开(公告)日:2022-10-14

    申请号:CN202110359699.0

    申请日:2021-04-02

    Abstract: 本申请实施例提供一种自监督训练方法及装置,涉及人工智能领域,该方法包括:获取图片样本数据集;对所述图片样本数据集进行近邻样本搜索,得到近邻样本集合;基于所述图片样本数据集及所述近邻样本集合进行近邻样本扩充,得到扩充样本;基于所述图片样本数据集、所述近邻样本集合及所述扩充样本进行训练模型的高层语义聚集;基于高层语义聚集结果进行迭代训练。本申请实施例提供的方法,能够提高对比学习的表达能力,进而提高训练任务的性能。

    预训练方法、装置、计算设备集群、及存储介质

    公开(公告)号:CN117830662A

    公开(公告)日:2024-04-05

    申请号:CN202211179875.3

    申请日:2022-09-27

    Abstract: 本申请涉及人工智能技术领域,公开了一种预训练方法、装置、计算设备集群、及存储介质,该方法包括:将第一图像输入预训练模型得到多个第一像素的特征,其中,第一图像属于多个数据集中的第一数据集,多个数据集与多个标签集一一对应,第一图像包括上述多个第一像素,多个第一像素中的每个第一像素的标签都属于第一数据集对应的标签集,多个标签集中的所有标签分别有一个对应的文本特征;根据上述多个第一像素的特征和多个标签集中的所有标签对应的文本特征更新预训练模型。本申请能够利用多个数据集进行联合预训练,并能自动利用不同数据集的标注之间的联系,从而提升预训练效果。

    语义分割方法、装置和存储介质
    13.
    发明公开

    公开(公告)号:CN117523560A

    公开(公告)日:2024-02-06

    申请号:CN202210940422.1

    申请日:2022-07-29

    Abstract: 本申请涉及一种语义分割方法、装置和存储介质。该方法可用于第一神经网络模型,该方法包括:获取待处理图像数据的第一图像特征数据;对第一图像特征数据进行特征增强,得到第一增强图像特征数据,第一增强图像特征数据包括图像内的上下文信息;利用第二图像特征数据对第一图像特征数据进行特征增强,得到第二增强图像特征数据,第二增强图像特征数据包括跨图像的上下文信息;根据第一增强图像特征数据和第二增强图像特征数据,确定待处理图像的预测掩码,预测掩码指示待处理图像的语义分割结果。根据本申请实施例,能够获得层次更丰富的特征信息,提高语义分割结果的准确性,可以得到更高效、迁移能力和性能更好的第一神经网络模型。

    识别对象的方法、装置及存储介质

    公开(公告)号:CN117333868A

    公开(公告)日:2024-01-02

    申请号:CN202210851482.6

    申请日:2022-07-19

    Abstract: 本申请公开了一种识别对象的方法、装置及存储介质,属于计算机视觉领域。所述方法包括:获取待处理的视觉数据和待识别的至少一个目标对象的指示信息;基于所述至少一个目标对象的指示信息获取语义信息,所述语义信息是用于描述所述至少一个目标对象的语义;基于对象识别模型和所述语义信息,识别所述视觉数据中的所述目标对象。本申请能够提高识别对象的灵活性。

    数据标注方法和装置和精细粒度识别方法和装置

    公开(公告)号:CN113688851B

    公开(公告)日:2023-09-15

    申请号:CN202010418518.2

    申请日:2020-05-18

    Abstract: 本申请提供了一种数据标注方法,采用至少两个结构不同的分类模型,预训练其中之一作为初始分类模型,且将待标注的源数据集的数据通过该预训练的分类模型标注标签作为初始数据;控制各所述分类模型执行一定次数的交替训练与数据标注,当前训练与当前数据标注的步骤包括:获取前一训练的分类模型所重新标注标签的数据,并从中选择一部分数据训练当前分类模型,通过经训练后的当前分类模型对未被选择的另一部分数据重新标注标签。还相应提供了数据标注装置、精细粒度识别模型训练方法和装置、精细粒度识别方法和装置,计算设备及介质,实现通过人工智能的方式自动标注数据,减少因数据标注困难、标注样本少带来的分类模型训练时的过拟合问题。

    基于多数据集的预训练方法、装置及存储介质

    公开(公告)号:CN116310614A

    公开(公告)日:2023-06-23

    申请号:CN202111571041.2

    申请日:2021-12-21

    Abstract: 本申请涉及一种基于多数据集的预训练方法、装置及存储介质,其中,所述方法包括:对第一样本图像进行跨数据集混合,得到第一目标图像,第一样本图像为训练集中的任一样本图像,训练集由多个数据集合并而成,每个数据集包括多个具有像素级标注信息的样本图像;对第一样本图像进行数据增强,得到第二目标图像;根据第一目标图像及第二目标图像,对第一特征提取网络进行预训练,第一特征提取网络应用于语义分割任务。本申请实施例的预训练基于像素级分类,与下游的语义分割任务之间不存在任务差距,从而能够提高语义分割模型在预训练阶段的性能。

    构建AI集成模型的方法、AI集成模型的推理方法及装置

    公开(公告)号:CN115964632A

    公开(公告)日:2023-04-14

    申请号:CN202110977566.X

    申请日:2021-08-24

    Abstract: 本申请提供了一种构建人工智能(AI)集成模型的方法,包括:获取训练数据集、初始图网络模型和多个基模型,然后利用训练数据集中的训练数据和多个基模型,迭代训练初始图网络模型,获得图网络模型,接着将图网络模型和多个基模型构建为AI集成模型,其中,图网络模型的输入为由多个基模型的输出构成的图结构。由于图网络模型在对图结构进行处理时,会考虑图结构中各节点的邻居节点,因此,图网络模型在对多个基模型的输出进行融合时,充分考虑了各个基模型之间的差异性和相关性,由此根据AI集成模型中的多个基模型和图网络模型获得的特征在用于AI任务的处理时,可以提高AI任务的执行结果的精度。

    视频生成方法、装置及集群
    19.
    发明公开

    公开(公告)号:CN118945442A

    公开(公告)日:2024-11-12

    申请号:CN202310912526.6

    申请日:2023-07-24

    Abstract: 一种视频生成方法、装置及集群。该方法包括:获取目标视频的文本描述信息和多个结构信息,多个结构信息和多个噪声样本一一对应;在第一时间步中,获取多个噪声样本中的第一噪声样本,第一噪声样本用于生成目标视频中的第一视频帧;利用预训练的扩散模型,基于文本描述信息和第一噪声样本对应的结构信息,去除第一噪声样本的噪声,得到第一噪声样本对应的第一中间样本;以及,更新第一噪声样本对应的第一中间样本的特征,得到第一噪声样本对应的第一输出样本;其中,第一噪声样本的第一输出样本用作第一时间步的下一个时间步的噪声样本,或者第一视频帧。该方法可以在无需训练模型的情况下,生成帧间一致性高的视频。

    模型训练方法及装置
    20.
    发明公开

    公开(公告)号:CN118608885A

    公开(公告)日:2024-09-06

    申请号:CN202310179445.X

    申请日:2023-02-28

    Abstract: 本公开的实施例提供了一种模型训练方法及装置,该方法包括:获取与图像处理任务相关联的训练数据集;获取初始模型,初始模型包括经预训练的编码器,经预训练的编码器是基于图像块冗余丢弃过程而被预训练得到的;以及利用训练数据集在初始模型的基础上进行训练,以得到用于图像处理任务的经训练的神经网络模型。以此方式,经预训练的编码器能够被用于与图像处理任务相关联的神经网络模型的初始模型,由于经训练的编码器基于图像块冗余丢弃过程得到,因此所消耗的计算资源少,效率高。

Patent Agency Ranking