-
公开(公告)号:CN117671055A
公开(公告)日:2024-03-08
申请号:CN202311582074.6
申请日:2023-11-23
Applicant: 华为技术有限公司
Abstract: 一种数据处理方法,包括:将用户输入文本作为大语言模型的输入,输出多个提示文本;将多个提示文本作为文图生成模型的输入,输出对应的多个图像。对用户输入文本和多个图像进行处理,得到每个图像的奖励分数,奖励分数与整体信息分数和局部信息分数有关。确定包括奖励分数为目标分数的至少一个提示文本为目标提示文本。将用户输入文本和目标提示文本作为第一训练样本,多个第一练样本对形成第一训练集。使用第一训练集训练大语言模型。也就是说,本申请通过训练大语言模型,使得大语言模型可以对用户输入文本进行扩充得到提示文本。进而,由于提示文本包括了丰富的细节和场景信息,因此文图生成模型可以生成包含丰富信息的图像。
-
公开(公告)号:CN114332845A
公开(公告)日:2022-04-12
申请号:CN202011057005.X
申请日:2020-09-29
Applicant: 华为技术有限公司
IPC: G06V20/64 , G06V20/58 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08 , G06T7/10 , G06T15/08
Abstract: 本申请实施例公开了一种3D目标检测的方法及设备,可应用于人工智能领域的计算机视觉领域,该方法包括:首先得到激光点云中各个激光点对应的2D信息,并再将激光点云和2D信息分别输入两个三维的稀疏卷积模块,得到第一特征和第二特征,再将第一特征和第二特征级联后输入一个二维的卷积模块,得到第三特征(即融合特征),第三特征再与第一特征和第二特征级联得到第四特征(即组合特征),最后利用第四特征实现3D目标检测。本申请实施例将该激光点云与2D信息在特征层面进行融合,提升了3D目标检测性能的同时保留了激光点云的原始特征,使该3D目标检测在夜晚、雨雾天等摄像头失效的复杂场景下具备良好的鲁棒性。
-
公开(公告)号:CN111292331A
公开(公告)日:2020-06-16
申请号:CN202010110152.2
申请日:2020-02-23
Applicant: 华为技术有限公司
IPC: G06T7/10
Abstract: 本申请提供一种图像处理的方法与装置。涉及人工智能领域,具体涉及计算机视觉领域。该方法包括:基于第一种图像处理任务的原始特征数据获取第一空间特征信息;根据第二种图像处理任务的原始特征数据与第一空间特征信息,获取第二特征数据;对第二特征数据进行第二种图像处理,获得第二种图像处理任务的处理结果;第一种图像处理任务与第二种图像处理任务分别为目标检测任务与实例分割任务中的一种与另一种。通过目标检测与实例分割中一方给另一方提供空间特征信息,目标检测和/或实例分割的特征数据可以得到校正,可以提高实例分割任务的预测准确度。
-
-