-
公开(公告)号:CN115268859A
公开(公告)日:2022-11-01
申请号:CN202210700376.8
申请日:2022-06-20
Applicant: 南开大学
Abstract: 本公开提供一种OpenCL TensorFlow的实现方法及装置、电子设备和存储介质。基于OpenCL编程标准,实现TensorFlow设备层的OpenCL Device支持;参照TensorFlow中的预设kernel的计算功能,基于OpenCL编程标准实现对应计算功能的OpenCL kernel和OpenCL算子;基于OpenCL编程标准,实现OpenCLElement‑wise算子库;将任务所需的计算加速库,进行OpenCL标准的适配;利用第一OpenCL计算加速库的API接口实现集成调用;实现StreamExecutor对OpenCL的支持,利用StreamExecutor的OpenCL后端实现对第二OpenCL计算加速库的集成调用。本发明实现了OpenCL版本的TensorFlow框架,从而实现TensorFlow框架对不同厂商的多类型异构设备的支持。
-
公开(公告)号:CN115268856A
公开(公告)日:2022-11-01
申请号:CN202210698398.5
申请日:2022-06-20
Applicant: 南开大学
Abstract: 本公开公开了OpenCL CUB库的实现方法及装置、电子设备和存储介质,涉及人工智能技术领域,基于OpenCL编程标准,设计CUB库相关算法,并且对于CUB库的封装、调用、编译方面进行重新设计,实现了基于OpenCL标准的CUB库,可为OpenCL版本深度学习框架和OpenCL应用程序开发提供高效支持。
-