-
公开(公告)号:CN114722999B
公开(公告)日:2025-02-07
申请号:CN202210245988.2
申请日:2022-03-14
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
IPC: G06N3/0464 , G06F17/16 , G06F7/523
Abstract: 本发明属于GEMM运算加速技术领域,为一种基于GEMM的深度神经网络加速方法和系统,该方法包括步骤:首先判断输入的矩阵乘法为规则矩阵乘法或不规则矩阵乘法;对于不同类型矩阵乘法采取不同分片方式:若为规则矩阵乘法,则遍历预制定分片策略选择最佳策略,若为不规则矩阵乘法,则首先根据预先制定的策略生成分片策略然后再进行策略选择;在选择分片策略时以Kernel Occupancy为依据;按照所选分片策略对矩阵进行分片;对矩阵片进行计算并合并计算结果。本发明通过GEMM利用两种不同的动态分片方式和KernelOccupancy,提高分片尺寸的适配度以减少不必要的内存加载次数同时提高CU的占有率。
-
公开(公告)号:CN108897507B
公开(公告)日:2021-11-23
申请号:CN201810408994.9
申请日:2018-05-02
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
Abstract: 本发明公开了一种基于安卓端智慧课堂的白板同步显示方法,涵盖了智慧课堂中的教师端和学生端两个方面,教师端和学生端基于MQTT即时通讯协议通信,通过该协议,师生可以订阅同一主题。在整个课堂活动中,教师在教师端中启动白板功能,教师书写白板并把消息发布到订阅了同一主题的学生,并在学生端中同步显示白板内容。教学过程中产生的白板数据会依据xAPI教育大数据标准,最终上报后台服务器。本发明对硬件设备的要求更低,特别适合工作于设备数量较多,设备计算能力较低,网络环境较不稳定的一对多场景下,能更方便地完成师生的教学互动分享,使用数字化手段,保障师生白板内容高效互通、分享与汇总。
-
公开(公告)号:CN108768826B
公开(公告)日:2021-03-19
申请号:CN201810465578.2
申请日:2018-05-16
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
IPC: H04L12/58 , H04L29/08 , H04L12/803 , H04L12/24
Abstract: 本发明公开了基于MQTT和Kafka高并发场景下的消息路由方法,该方法充分利用MQTT轻量级协议在通信中支持数百万个设备同时连接的特点,引入Kafka集群以弥补MQTT协议不支持负载均衡的缺陷,并通过磁盘顺序写速度快的特点来应对高并发场景下的应用需求,大大提高了消息的传送速度,支持实时数据流的保存和异步处理。
-
公开(公告)号:CN114722999A
公开(公告)日:2022-07-08
申请号:CN202210245988.2
申请日:2022-03-14
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
Abstract: 本发明属于GEMM运算加速技术领域,为一种基于GEMM的深度神经网络加速方法和系统,该方法包括步骤:首先判断输入的矩阵乘法为规则矩阵乘法或不规则矩阵乘法;对于不同类型矩阵乘法采取不同分片方式:若为规则矩阵乘法,则遍历预制定分片策略选择最佳策略,若为不规则矩阵乘法,则首先根据预先制定的策略生成分片策略然后再进行策略选择;在选择分片策略时以Kernel Occupancy为依据;按照所选分片策略对矩阵进行分片;对矩阵片进行计算并合并计算结果。本发明通过GEMM利用两种不同的动态分片方式和KernelOccupancy,提高分片尺寸的适配度以减少不必要的内存加载次数同时提高CU的占有率。
-
公开(公告)号:CN114692079B
公开(公告)日:2025-02-14
申请号:CN202210294486.9
申请日:2022-03-24
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
Abstract: 本发明公开了一种GPU批量矩阵乘法加速器,包括由工作组管理器、指令译码处理器、高速存储单元、共享内存单元、计算单元、DMA组成主分支电路,用于对矩阵数据进行批次序优化,得到矩阵分片,将矩阵分片载入到计算单元中;由指令译码处理器、高速存储单元、共享内存单元、计算单元、DMA组成旁分支电路,当不进行批次序优化时,对矩阵数据直接进行内核函数计算,得到矩阵计算结果;本发明可以有效提高计算单元的利用效率并达到各个计算单元任务量的负载均衡,提高运行时的计算密度,达到更高的指令并行性、线程并行性和访存并行性,从而充分发挥硬件的计算能力,达到计算加速的目的。
-
公开(公告)号:CN114782311B
公开(公告)日:2024-05-14
申请号:CN202210245783.4
申请日:2022-03-14
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
IPC: G06T7/00 , G06N3/0464 , G06N3/045 , G06N3/084 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于CenterNet改进的多尺度缺陷目标检测方法,包括以下步骤:获取缺陷目标图片并进行预处理;对CenterNet网络结构进行改进;将预处理图片输入改进CenterNet网络结构,生成若干个第一特征图;将第一特征图进行信息叠加,形成若干个第二特征图;通过限定多种目标尺度信息生成多层分支热力图以产生类别标签,将目标映射到对应的第二特征图;经过第二特征图后通过热力图生成分支产生预测类别,通过目标宽高及中心偏移生成分支产生位置信息,进而得到检测结果;本发明把分支网络调整为基于多尺度特征层的多输出预测,再通过网络输出结果还原原始预测目标框信息,解决了不同尺度目标预测能力受限问题。
-
公开(公告)号:CN114782311A
公开(公告)日:2022-07-22
申请号:CN202210245783.4
申请日:2022-03-14
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
IPC: G06T7/00 , G06K9/62 , G06N3/04 , G06N3/08 , G06V10/764 , G06V10/774 , G06V10/80 , G06V10/82
Abstract: 本发明公开了一种基于CenterNet改进的多尺度缺陷目标检测方法,包括以下步骤:获取缺陷目标图片并进行预处理;对CenterNet网络结构进行改进;将预处理图片输入改进CenterNet网络结构,生成若干个第一特征图;将第一特征图进行信息叠加,形成若干个第二特征图;通过限定多种目标尺度信息生成多层分支热力图以产生类别标签,将目标映射到对应的第二特征图;经过第二特征图后通过热力图生成分支产生预测类别,通过目标宽高及中心偏移生成分支产生位置信息,进而得到检测结果;本发明把分支网络调整为基于多尺度特征层的多输出预测,再通过网络输出结果还原原始预测目标框信息,解决了不同尺度目标预测能力受限问题。
-
公开(公告)号:CN114692079A
公开(公告)日:2022-07-01
申请号:CN202210294486.9
申请日:2022-03-24
Applicant: 华南理工大学 , 中山市华南理工大学现代产业技术研究院
Abstract: 本发明公开了一种GPU批量矩阵乘法加速器,包括由工作组管理器、指令译码处理器、高速存储单元、共享内存单元、计算单元、DMA组成主分支电路,用于对矩阵数据进行批次序优化,得到矩阵分片,将矩阵分片载入到计算单元中;由指令译码处理器、高速存储单元、共享内存单元、计算单元、DMA组成旁分支电路,当不进行批次序优化时,对矩阵数据直接进行内核函数计算,得到矩阵计算结果;本发明可以有效提高计算单元的利用效率并达到各个计算单元任务量的负载均衡,提高运行时的计算密度,达到更高的指令并行性、线程并行性和访存并行性,从而充分发挥硬件的计算能力,达到计算加速的目的。
-
公开(公告)号:CN119760117A
公开(公告)日:2025-04-04
申请号:CN202411914555.7
申请日:2024-12-24
Applicant: 华南理工大学
IPC: G06F16/334 , G06F16/35 , G06F40/205 , G06F40/30
Abstract: 本发明公开了一种基于动态上下文窗口的专利数据分析方法,属于文本数据分析技术领域,包括:进行领域特征提取,得到查询量q;基于专利文档d与查询量q的相似度对专利文档d排序;使用递归分块算法按排序的顺序将专利文档拆分为最小语义单元,使用局部对齐算法和层次缩减算法以保持文档结构;进行特征提取;结合技术领域特征权重和技术相关度进行软聚类;计算并存储片段间的技术关联概率;建立基于构建的编号的快速检索树;按文档重要性依次对获取的核心片段进行动态调整上下文窗口大小,进行扩展上下文。所述基于动态上下文窗口的专利数据分析方法解决了现有的专利数据分析方式由于存在上下窗口限制的问题,导致分析的效果不佳的问题。
-
公开(公告)号:CN117670637A
公开(公告)日:2024-03-08
申请号:CN202311624050.2
申请日:2023-11-30
Applicant: 华南理工大学
IPC: G06T1/00 , G06T7/90 , G06T5/10 , G06T3/4007 , G06T3/02
Abstract: 本发明涉及软件测试和智能计算技术领域,为基于强鲁棒性多域变换的图像盲水印嵌入和完全提取方法。该方法包括:提取原始图像的YUV通道;对YUV通道进行二级haar小波变换;对于低频信息矩阵使用DCT变换;对分块频域矩阵使用奇异值分解提取频域矩阵对应的特征值;使用可变水印嵌入算法对分块频域矩阵进行水印嵌入;对分块频域矩阵进行逆奇异值分解,逆离散余弦变换和逆小波变换操作,得到载水印图像;对于图像使用水印提取变换算法进行嵌入水印逆操作,提取出张待提取图像嵌入的水印每个bit位值;通过水印值聚类算法纠正水印的bit位值分布偏移,输出最终的水印值。本发明能更加隐秘地嵌入图像水印和能从多种图像攻击中恢复水印,提高图像水印的鲁棒性。
-
-
-
-
-
-
-
-
-