神经网络架构的搜索方法及相关设备

    公开(公告)号:CN116361530A

    公开(公告)日:2023-06-30

    申请号:CN202111599816.7

    申请日:2021-12-24

    Abstract: 本申请实施例提供了一种神经网络架构的搜索方法、装置、电子设备、计算机可读存储介质及计算机程序产品,涉及人工智能技术领域。该方法包括:获取搜索空间对应的超网络的性能信息;基于获取的性能信息,优化超网络的网络结构参数,或从搜索空间对应的超网络中搜索神经网络架构。本申请的实施有利于提高搜索得到的神经网络架构的性能。同时,由电子设备执行的上述神经网络架构的搜索方法可以使用人工智能模型来执行。

    神经网络架构搜索方法及电子设备

    公开(公告)号:CN115222011A

    公开(公告)日:2022-10-21

    申请号:CN202110414442.0

    申请日:2021-04-16

    Abstract: 本申请实施例涉及AI技术领域,提供了一种神经网络架构搜索方法。该方法中,在获得搜索空间内的第一候选操作集之后,电子设备根据第一候选操作集各个候选操作的权值,从第一候选操作集中获得至少两个第一目标操作,以根据该至少两个第一目标操作获得数据处理网络。其中,第一候选操作集包含搜索空间内至少两个子空间的候选操作,且第一候选操作集中各个候选操作的权值的和为1。即,本方法以全部候选子空间作为权值归一化的基础。可见,采用本技术方案,基于搜索空间的全局性能从搜索空间中获得数据处理网络,从而能够确保所得到的数据处理网络的性能最佳。

    多媒体数据描述模型的训练方法和描述信息的生成方法

    公开(公告)号:CN113747168A

    公开(公告)日:2021-12-03

    申请号:CN202010478653.6

    申请日:2020-05-29

    Inventor: 林科 甘卓欣

    Abstract: 本申请提供了多媒体数据描述模型的训练方法和描述信息的生成方法,该模型包括依次级联的编码模块和解码模块,解码模块包括至少一个解码器,该训练方法包括:获取训练数据集;基于训练数据集对模型进行训练,直至模型的总损失函数收敛;总损失函数包括第一损失函数,训练时,对于训练数据集中的每一样本多媒体数据,将该样本多媒体数据输入至编码模块中,得到编码特征,将编码特征分别输入至各解码器中,得到各解码器的第一解码结果;基于各样本多媒体数据的各描述标注和对应于各解码器的第一解码结果,计算第一损失函数的值。基于本申请提供的方法,能够有效提高生成的多媒体数据的描述信息的准确性。

Patent Agency Ranking