神经网络架构搜索的方法、装置、设备和存储介质

    公开(公告)号:CN116415647A

    公开(公告)日:2023-07-11

    申请号:CN202111641483.X

    申请日:2021-12-29

    Abstract: 本申请提供了一种神经网络架构搜索的方法、装置、设备和存储介质,属于深度学习技术领域。该方法包括:接收优化请求,该优化请求包括待优化模型的模型文件和优化要求,优化要求包括性能要求和硬件要求,基于该模型文件,在搜索空间中进行神经架构搜索处理,获得满足优化要求的神经网络架构,返回该神经网络架构。采用本申请,能够使用模型文件进行神经架构搜索,不仅不需要使用公开数据集进行神经架构搜索,而且使得搜索到神经网络架构适合本地业务。

    一种数据处理方法和相关设备
    3.
    发明公开

    公开(公告)号:CN118152505A

    公开(公告)日:2024-06-07

    申请号:CN202211520623.2

    申请日:2022-11-30

    Abstract: 本申请实施例公开了一种数据处理方法和相关设备,用于为目标模型确定较优的参数量切分方法。在本申请中,首先获取第一查询表,第一查询表包括多个随机编码及其在目标模型在M个模型训练设备中的运行时长,多个随机编码中的任意一个表征M个模型训练设备对目标模型的参数量切分方式,M为正整数。接着,基于第一查询表进行机器学习,得到运行时长预测器,运行时长预测器用于基于输入的随机编码预测在目标模型中输出的运行时长。最后,以第一查询表为输入,以运行时长更短为目标,基于预设的进化算法对多个随机编码进行编码搜索,从而得到运行时长较短的目标随机编码,即确定了可以高效运行的M个模型训练设备对目标模型的参数量切分方式。

Patent Agency Ranking