深度学习模型的分布式训练方法、装置、设备及存储介质

    公开(公告)号:CN113610241A

    公开(公告)日:2021-11-05

    申请号:CN202110884863.X

    申请日:2021-08-03

    Inventor: 田丽红 胡辰 许涛

    Abstract: 本发明实施例公开了一种深度学习模型的分布式训练方法、装置、设备及存储介质。该方法包括:获取目标深度学习模型的TensorFlow训练代码;确定所述TensorFlow训练代码的目标逻辑及封装类型;根据与所述目标逻辑及封装类型匹配的处理策略对所述TensorFlow训练代码进行调整;运行调整后的TensorFlow训练代码,以实现对所述目标深度学习模型的Horovod分布式训练。上述技术方案在Tensorflow代码背景下,自动实现深度学习模型的Horovod分布式训练计算的技术效果。

    一种集群机柜
    5.
    发明公开

    公开(公告)号:CN102289270A

    公开(公告)日:2011-12-21

    申请号:CN201110262501.3

    申请日:2011-09-06

    Abstract: 本发明提供了一种刀片服务器的集群机柜。该集群机柜包括:多片刀片服务器;以及散热部件,内置于刀片服务器中,用于为多个刀片服务器散热;其中,相邻的刀片服务器之间的距离为2U。根据本发明,采用相邻刀片服务器之间的距离为2U,节约空间的同时,提高了散热效率和性能,便于统一管理,同时降低了噪声。同时该集群机柜具有:较高性能,移动灵活、高扩展性、高可用性、以及高度统一等特点。

    一种应用测试方法、装置、计算机设备及存储介质

    公开(公告)号:CN113268426A

    公开(公告)日:2021-08-17

    申请号:CN202110590499.6

    申请日:2021-05-28

    Inventor: 艾珊珊 许涛 胡辰

    Abstract: 本发明实施例公开了一种应用测试方法、装置、计算机设备及存储介质,方法包括:获取适用于主流应用平台的目标应用的目标测试用例;根据所述目标测试用例测试所述目标应用在异构应用平台的应用功能支持结果;在确定所述应用功能支持结果通过应用功能性测试的情况下,在所述异构应用平台中测试所述目标应用的应用性能。本发明实施例的技术方案能够快速排查异构应用平台的功能缺陷和性能差异问题,从而提高应用的测试效率和测试质量,进而保证应用在异构应用平台的运行效果。

    框架的部署方法、装置、计算机设备和存储介质

    公开(公告)号:CN113190238A

    公开(公告)日:2021-07-30

    申请号:CN202110327542.X

    申请日:2021-03-26

    Inventor: 艾姗姗 胡辰 许涛

    Abstract: 本申请涉及一种框架的部署方法、装置、计算机设备和存储介质。所述方法包括:根据待部署集群中各物理机的开发环境信息,搭建待部署集群的目标框架的开发环境,获取目标框架的配置文件,并在开发环境中根据配置文件生成目标框架;对目标框架进行功能性验证,并在目标框架验证通过的情况下将目标框架的框架安装包存储在共享服务器上,以使待部署集群中的各物理机从共享服务器上获取框架安装包进行目标框架的部署。上述方法通过测试机模拟待部署集群中的各物理机的开发环境,可以使之后基于该模拟的开发环境获取到的目标框架能够适用于待部署集群中的任一物理机,进而提高了目标框架在物理机上的部署效率。

Patent Agency Ranking