-
公开(公告)号:CN115268859A
公开(公告)日:2022-11-01
申请号:CN202210700376.8
申请日:2022-06-20
Applicant: 南开大学
Abstract: 本公开提供一种OpenCL TensorFlow的实现方法及装置、电子设备和存储介质。基于OpenCL编程标准,实现TensorFlow设备层的OpenCL Device支持;参照TensorFlow中的预设kernel的计算功能,基于OpenCL编程标准实现对应计算功能的OpenCL kernel和OpenCL算子;基于OpenCL编程标准,实现OpenCLElement‑wise算子库;将任务所需的计算加速库,进行OpenCL标准的适配;利用第一OpenCL计算加速库的API接口实现集成调用;实现StreamExecutor对OpenCL的支持,利用StreamExecutor的OpenCL后端实现对第二OpenCL计算加速库的集成调用。本发明实现了OpenCL版本的TensorFlow框架,从而实现TensorFlow框架对不同厂商的多类型异构设备的支持。
-
公开(公告)号:CN115268857A
公开(公告)日:2022-11-01
申请号:CN202210698399.X
申请日:2022-06-20
Applicant: 南开大学
Abstract: 本公开公开了OpenCLDNN库的集成方法及装置、系统和电子设备,具体涉及人工智能技术领域,在StreamExecutor中实现OpenCL Platform,并注册到TensorFlow框架中;所述OpenCL Platform为根据指令进行创建、指定对应的设备Platform;在StreamExecutor中实现OpenCLExecutor,并注册到TensorFlow框架中;在StreamExecutor中的LibrarySupport层完成OpenCL DNN的注册和接入;在TensorFlow框架中将OpenCL DNN库中对应的算子与OpenCL设备绑定并进行注册;实现了OpenCL DNN库在TensorFlow框架中的集成,使得TensorFlow框架在OpenCL硬件设备上运行时可以对深度神经网络常用的算子进行计算加速。
-
公开(公告)号:CN114758343A
公开(公告)日:2022-07-15
申请号:CN202210279041.3
申请日:2022-03-21
Applicant: 南开大学
Abstract: 一种基于CNN的深度学习网络RugbyNet的构建方法,属于计算机应用领域。RugbyNet构建方法包括:对训练集中图像进行归一化处理;采用包含两个卷积的卷积块1处理并池化;然后采用包含三个卷积的卷积块2处理并池化;接着采用包含四个卷积的卷积块3处理并池化;再次采用包含三个卷积的卷积块4处理并池化;进一步采用包含两个卷积的卷积块5处理;最后进行GWAP层和softmax层处理,并根据损失函数进行图像分类模型参数优化。基于RugbyNet分别对汉字的图像和字形进行独立图像分类,并结合二者的输出结果得到更精准的汉字分类。RugbyNet网络可有效提高图像分类的准确性,尤其是手写体汉字识别。
-
公开(公告)号:CN113392772B
公开(公告)日:2022-04-19
申请号:CN202110669815.9
申请日:2021-06-17
Applicant: 南开大学
IPC: G06V30/32 , G06V10/56 , G06V10/774 , G06K9/62 , G06N20/00
Abstract: 本发明公开了一种面向文字识别的文字图像收缩变形增强方法,属于计算机领域。一种面向文字识别的文字图像收缩变形增强方法包括:获取“原文字图像”尺寸及颜色信息;创建一个与“原文字图像”尺寸相同的空白“新文字图像”;设置“原文字图像”和“新文字图像”具有相同的基准点;设置收缩变形系数k;遍历“新文字图像”上的每一个像素点R,根据收缩变形函数f(d)计算出在“原文字图像”上对应的像素点P,并将“新文字图像”上的像素点R的颜色值设置为“原文字图像”中像素点P的颜色值;完成“新文字图像”的生成。本发明将给定的文字图像进行收缩变形来建立新风格的文字图像,从而丰富机器学习的训练数据集,并提高文字识别的准确率。
-
-
-