一种面向AI识别汉字的文字图像扭曲变形方法

    公开(公告)号:CN113392780A

    公开(公告)日:2021-09-14

    申请号:CN202110675196.4

    申请日:2021-06-17

    Applicant: 南开大学

    Abstract: 本发明公开了一种面向AI识别汉字的文字图像扭曲变形方法,属于计算机领域。一种面向AI识别汉字的文字图像扭曲变形方法包括:获取“原文字图像”尺寸及颜色信息;创建一个与“原文字图像”尺寸相同的空白“新文字图像”;设置扭曲变形频率系数、扭曲变形初相系数和扭曲变形振幅系数;遍历“新文字图像”上的每一个像素点R,根据扭曲变形函数g(x)进行文字图像的纵向扭曲变形、根据扭曲变形函数g(y)进行文字图像的横向扭曲变形。本发明通过扭曲变形来建立新风格的文字图像,极大地丰富文字图像的训练数据集,从而提高基于训练数据集的手写体汉字识别算法的准确率。

    一种深度学习任务运行方法、装置、介质及产品

    公开(公告)号:CN118428489A

    公开(公告)日:2024-08-02

    申请号:CN202410587245.2

    申请日:2024-05-13

    Applicant: 南开大学

    Abstract: 本发明公开一种深度学习任务运行方法、装置、介质及产品,涉及深度学习技术领域,方法包括:创建一个能够满足运行环境信息和运行资源信息的Docker容器,在Docker容器中运行深度学习任务代码,同时在守护进程发现运行深度学习任务代码的子进程已结束时,查询子进程的执行状态,当子进程异常退出时重新开始在Docker容器中运行深度学习任务代码,从而将一个深度学习任务放置在一个独立的Docker容器中运行,使不同的深度学习任务在不同的运行环境下运行,实现运行环境的个性化配置,通过守护进程检测的方式确保深度学习任务的正常执行。

    PyTorch框架中加速库的高效调用方法及装置

    公开(公告)号:CN117608797A

    公开(公告)日:2024-02-27

    申请号:CN202311650471.2

    申请日:2023-12-05

    Applicant: 南开大学

    Abstract: 本发明公开一种PyTorch框架中加速库的高效调用方法及装置,涉及加速库高效调用技术领域,在绑定句柄时,预先基于单例模式创建句柄绑定类,仅在第一次绑定时生成句柄实例,后续则直接取出句柄实例,在计算显存空间时,创建第一高速缓存Cache类,仅在第一次计算时计算卷积核参数类的显存空间,后续则直接取出卷积核参数类的显存空间,在选取卷积算法时,创建第二高速缓存Cache类,仅在第一次选取时选取卷积核参数类的卷积算法,后续则直接取出卷积核参数类的卷积算法,能够在支持OpenCL的计算设备上,实现PyTorch框架中加速库的高效调用,有利于将PyTorch框架转码到支持OpenCL的计算设备上。

    OpenCL设备及其内存的管理方法
    14.
    发明公开

    公开(公告)号:CN116955214A

    公开(公告)日:2023-10-27

    申请号:CN202310875847.3

    申请日:2023-07-17

    Applicant: 南开大学

    Abstract: 本公开公开了OpenCL设备及其内存的管理方法,涉及信息技术领域,基于内存管理模块与OpenCL设备上的内存地址之间的索引信息获取内存地址;通过内存地址索引OpenCL设备上内存地址对应的存储区;基于存储内存地址的存储张量对存储区进行调用,存储张量为预设深度学习框架中的数据存储单位;基于预设深度学习框架对存储张量进行生命周期机制的管理,以对存储区进行生命周期机制的管理。与相关技术相比,预设深度学习框架使用内存管理模块获取内存地址,基于内存地址与存储张量之间的映射关系,实现预设深度学习框架对存储区的间接管理,且根据获取内存地址的预设深度学习框架种类的不同,实现不同种类的深度学习框架对存储区的管理。

    大规模文本数据的去重方法及装置、电子设备和存储介质

    公开(公告)号:CN115293126A

    公开(公告)日:2022-11-04

    申请号:CN202210700368.3

    申请日:2022-06-20

    Applicant: 南开大学

    Abstract: 本公开公开了大规模文本数据的去重方法及装置、电子设备和存储介质,涉及数据处理领域,主要技术方案包括:将第一待去重数据划分至少两个数据段,每个数据段包含至少两个数据;在第一数据段内,分别针对单个数据执行预设哈希算法,得至少一个哈希分块;对第一数据段内的至少两个数据执行去重计算,得第二待去重数据;依次将第二待去重数据中的哈希分块与预设参考数据库中的哈希分块进行比对;根据比对结果的相似度进行二次去重计算,并继续执行第一待去重数据中剩余的第二数据段内的去重计算。与相关技术相比,本公开实施例将大规模数据拆分成小段数据,然后依次对每段数据进行去重操作,进而实现文本数据去重规模突破设备内存限制。

    一种面向AI识别汉字的文字图像扭曲变形方法

    公开(公告)号:CN113392780B

    公开(公告)日:2022-04-19

    申请号:CN202110675196.4

    申请日:2021-06-17

    Applicant: 南开大学

    Abstract: 本发明公开了一种面向AI识别汉字的文字图像扭曲变形方法,属于计算机领域。一种面向AI识别汉字的文字图像扭曲变形方法包括:获取“原文字图像”尺寸及颜色信息;创建一个与“原文字图像”尺寸相同的空白“新文字图像”;设置扭曲变形频率系数、扭曲变形初相系数和扭曲变形振幅系数;遍历“新文字图像”上的每一个像素点R,根据扭曲变形函数g(x)进行文字图像的纵向扭曲变形、根据扭曲变形函数g(y)进行文字图像的横向扭曲变形。本发明通过扭曲变形来建立新风格的文字图像,极大地丰富文字图像的训练数据集,从而提高基于训练数据集的手写体汉字识别算法的准确率。

    一种由汉字重心点向外扩张变形创造新风格字体的方法

    公开(公告)号:CN113420647A

    公开(公告)日:2021-09-21

    申请号:CN202110689792.8

    申请日:2021-06-22

    Applicant: 南开大学

    Abstract: 本发明公开了一种由汉字重心点向外扩张变形创造新风格字体的方法,属于计算机领域。由汉字重心点向外扩张变形创造新风格字体的方法包括:输入给定风格字体的汉字并转换为汉字图片,或直接输入汉字图片,简称“原文字图片”;获取“原文字图片”尺寸、前景色及重心点;获取“原文字图片”汉字笔画轮廓线;创建一个与“原文字图片”尺寸相同的空白“新文字图片”;设置扩张变形系数;针对“原文字图片”汉字笔画轮廓线上每个点Pi,根据扩张变形函数计算出“新文字图片”上对应点Ri,并进一步与前一点Ri‑1进行连接;对“新文字图片”汉字笔画轮廓线内填充,完成“新文字图片”生成。本发明有助于机器高效自动化创造更多新风格汉字字体。

    一种基于大规模网络的数据分类方法和装置

    公开(公告)号:CN114861753B

    公开(公告)日:2025-05-13

    申请号:CN202210306441.9

    申请日:2022-03-25

    Applicant: 南开大学

    Abstract: 本发明公开了一种基于大规模网络的数据分类方法和装置,其中,该方法包括:获取待检测数据;其中,待检测数据包括系统级指标和用户级指标;对待检测数据的多变量时间序列进行平滑和归一化的数据预处理得到预处理数据;将预处理数据输入通过离线聚类训练好的一维卷积自动编码器进行数据压缩处理,并使用离线聚类得到的特征索引执行特征选择,根据特征选择的结果进行距离计算,以进行在线数据分类;基于在线数据分类,输出待检测数据的在线分类结果。本发明可以根据系统实例的正常模式对其进行精确且高效聚类并显著减少异常检测训练开销。

    一种基于计算机视觉的GUI软件自动化测试系统及方法

    公开(公告)号:CN118245368A

    公开(公告)日:2024-06-25

    申请号:CN202410334920.0

    申请日:2024-03-22

    Applicant: 南开大学

    Inventor: 张玉志 潘磊

    Abstract: 本发明公开了一种基于计算机视觉的GUI软件自动化测试系统及方法,涉及软件工程技术领域,该系统包括计算机视觉模块、测试驱动模块和动作模拟模块;其中,计算机视觉模块包括多种基于深度学习的目标检测模型,根据各目标检测模型识别的UI元素,得到目标关键字集合;动作模拟模块用于模拟用户在目标GUI软件上的动作交互,得到动作关键字集合;测试驱动模块中测试用例生成子模块用于根据目标关键字集合和动作关键字集合生成目标GUI软件的测试用例,测试用例执行子模块用于执行目标GUI软件的测试用例,得到测试结果。本发明运用基于深度学习的计算机视觉技术,实现对软件界面的精准识别,显著提升了测试自动化的可靠性。

Patent Agency Ranking