-
公开(公告)号:CN117669691A
公开(公告)日:2024-03-08
申请号:CN202311086784.X
申请日:2023-08-25
Applicant: 华为技术有限公司
IPC: G06N3/094 , G06N3/0895 , G06N3/0475 , G06N3/045 , G06T15/02 , G06V40/10 , G06V40/16 , G06V10/74 , G06V10/80
Abstract: 一种数据处理方法,应用于人工智能领域,包括:获取第一文本和第一图像;所述第一文本为人物的描述信息;所述第一图像为以所述第一文本为条件通过生成网络得到的图像,所述第一文本的语义包括标签,所述标签用于描述所述人物的部分特征;对与标签相关联的至少一个身体部位的第一特征表示进行融合,并根据融合结果,更新生成网络。本申请可以使得训练后的生成网络具备细粒度的数据处理能力,提高后续数据生成的效果。
-
公开(公告)号:CN117453949A
公开(公告)日:2024-01-26
申请号:CN202311232024.5
申请日:2023-09-21
Applicant: 华为技术有限公司
IPC: G06F16/78 , G06F16/783 , G06V10/762 , G06V20/40 , G06V10/40 , G06V10/74 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/09
Abstract: 本申请提供计算机视觉领域的一种视频定位方法以及装置,可以利用无标注的视频数据进行训练,降低标注成本,大大降低视频定位所需的人力开销,且可以实现零样本的视频定位,泛化能力非常强。该方法包括:获取视频数据集合,视频数据集合中包括视频数据,该视频数据包括多帧图像;分别获取视频数据的第一视频特征和第一文本特征,该第一视频特征为从视频数据中提取到的特征,该第一文本特征包括描述视频数据中每帧图像的多个词;随后,对第一视频特征进行切分,得到多个视频片段的特征;并对多个词与多个视频片段进行映射,得到每个视频片段对应的文本描述;根据每个视频片段对应的文本描述,对视频定位模型进行训练,得到训练后的视频定位模型。
-
公开(公告)号:CN115268736B
公开(公告)日:2024-12-20
申请号:CN202110483579.1
申请日:2021-04-30
Applicant: 华为技术有限公司
IPC: G06F3/0484 , G06F9/451 , H04M1/72454 , G10L15/22
Abstract: 本申请涉及终端界面显示、终端界面切换(跳转)领域,具体涉及一种界面切换方法及电子设备,所述方法包括:显示第一界面;接收触发指令,所述触发指令用于触发界面切换;所述触发指令包括第二界面的进程和第二界面的内容信息;根据所述触发指令中包含的所述第二界面的进程和所述第二界面的内容信息,获取与所述第二界面相关联的上下文数据;根据所述与所述第二界面相关联的上下文数据,从显示的所述第一界面切换至所述第二界面。基于本申请提供的技术方案,可以实现应用特定界面的切换,优化了用户的体验感。
-
公开(公告)号:CN115268736A
公开(公告)日:2022-11-01
申请号:CN202110483579.1
申请日:2021-04-30
Applicant: 华为技术有限公司
IPC: G06F3/0484 , G06F9/451 , H04M1/72454 , G10L15/22
Abstract: 本申请涉及终端界面显示、终端界面切换(跳转)领域,具体涉及一种界面切换方法及电子设备,所述方法包括:显示第一界面;接收触发指令,所述触发指令用于触发界面切换;所述触发指令包括第二界面的进程和第二界面的内容信息;根据所述触发指令中包含的所述第二界面的进程和所述第二界面的内容信息,获取与所述第二界面相关联的上下文数据;根据所述与所述第二界面相关联的上下文数据,从显示的所述第一界面切换至所述第二界面。基于本申请提供的技术方案,可以实现应用特定界面的切换,优化了用户的体验感。
-
-
-