OpenCL PyTorch的实现方法
    1.
    发明公开

    公开(公告)号:CN116976430A

    公开(公告)日:2023-10-31

    申请号:CN202310871880.9

    申请日:2023-07-17

    Applicant: 南开大学

    Abstract: 本公开公开了OpenCL PyTorch的实现方法,涉及机器学习技术领域。主要技术方案包括:首先,基于OpenCL标准实现可在OpenCL设备中运算的OpenCL算子库;其中,所述OpenCL算子库用于接收PyTorch框架发送的算子调用信息;其次,建立所述OpenCL算子库与OpenCL核函数库之间的链接;其中,所述OpenCL核函数库包含至少一个用户开发的OpenCL核函数接口或开源OpenCL计算库的核函数接口;最后,基于所述OpenCL算子库,实现PyTorch框架对所述OpenCL核函数库的调用。通过将PyTorch框架的OpenCL算子调用需求进行分解,并基于OpenCL核函数库调用OpenCL设备进行执行计算;PyTorch框架可以利用支持OpenCL标准的设备训练和部署深度学习模型,实现了可支持OpenCL编程标准的完整深度学习框架。

    OpenCL DNN库的实现方法、装置、电子设备及存储介质

    公开(公告)号:CN115268858A

    公开(公告)日:2022-11-01

    申请号:CN202210698403.2

    申请日:2022-06-20

    Applicant: 南开大学

    Abstract: 本申请提供了一种OpenCL DNN库的实现方法、装置、电子设备及存储介质,涉及机器学习技术领域,主要技术方案包括:首先通过对预设深度神经网络库的重构和修改,实现通用OpenCL DNN库,对所述OpenCL DNN库中的OpenCL核函数对应的API接口进行封装,以便通过所述API接口调用所述核函数。与相关技术的封闭性相比,此方法通过重构预设深度神经网络库中OpenCL目标核函数与接口函数,完成了预设深度神经网络库的通用化修改,实现了OpenCLDNN库在OpenCL硬件设备上使用和执行的通用性。

    OpenCL TensorFlow的实现方法及装置、电子设备和存储介质

    公开(公告)号:CN115268859A

    公开(公告)日:2022-11-01

    申请号:CN202210700376.8

    申请日:2022-06-20

    Applicant: 南开大学

    Abstract: 本公开提供一种OpenCL TensorFlow的实现方法及装置、电子设备和存储介质。基于OpenCL编程标准,实现TensorFlow设备层的OpenCL Device支持;参照TensorFlow中的预设kernel的计算功能,基于OpenCL编程标准实现对应计算功能的OpenCL kernel和OpenCL算子;基于OpenCL编程标准,实现OpenCLElement‑wise算子库;将任务所需的计算加速库,进行OpenCL标准的适配;利用第一OpenCL计算加速库的API接口实现集成调用;实现StreamExecutor对OpenCL的支持,利用StreamExecutor的OpenCL后端实现对第二OpenCL计算加速库的集成调用。本发明实现了OpenCL版本的TensorFlow框架,从而实现TensorFlow框架对不同厂商的多类型异构设备的支持。

    OpenCL DNN库的集成方法及装置、系统和电子设备

    公开(公告)号:CN115268857A

    公开(公告)日:2022-11-01

    申请号:CN202210698399.X

    申请日:2022-06-20

    Applicant: 南开大学

    Abstract: 本公开公开了OpenCLDNN库的集成方法及装置、系统和电子设备,具体涉及人工智能技术领域,在StreamExecutor中实现OpenCL Platform,并注册到TensorFlow框架中;所述OpenCL Platform为根据指令进行创建、指定对应的设备Platform;在StreamExecutor中实现OpenCLExecutor,并注册到TensorFlow框架中;在StreamExecutor中的LibrarySupport层完成OpenCL DNN的注册和接入;在TensorFlow框架中将OpenCL DNN库中对应的算子与OpenCL设备绑定并进行注册;实现了OpenCL DNN库在TensorFlow框架中的集成,使得TensorFlow框架在OpenCL硬件设备上运行时可以对深度神经网络常用的算子进行计算加速。

Patent Agency Ranking