-
公开(公告)号:CN117971472A
公开(公告)日:2024-05-03
申请号:CN202410120605.8
申请日:2024-01-29
Abstract: 本申请涉及一种基于ARM处理器的SpMV并行加速处理方法与系统,其中,方法包括:加载稀疏矩阵;若当前ARM处理器支持NUMA,则获取最大NUMA节点数目m,并将已加载的所述稀疏矩阵基于m进行行划分;将划分好的所述稀疏矩阵根据NUMA策略分配到各个节点上,并将每个节点上的子矩阵再根据线程数再次划分;将每个线程中需要处理的子矩阵按照列的相似度进行重排,并将对应的向量也重新排序;将排序后的子矩阵转换为对齐的CSR格式,并且每个线程将对齐的CSR格式的子矩阵与对应的向量进行SpMV处理;将每个节点上的SpMV相乘结果合并得到计算结果。整个过程中,通过列重排显著减少对齐的CSR格式中的向量对,可以显著加速SpMV操作,实现高效的基于ARM处理器的SpMV并行加速处理。
-
公开(公告)号:CN115987292A
公开(公告)日:2023-04-18
申请号:CN202211702359.4
申请日:2022-12-29
Applicant: 湖南大学
IPC: H03M7/30
Abstract: 本申请涉及一种嵌入式编码方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待编码数据,根据待编码数据生成尾数矩阵;对尾数矩阵进行梯形结构检测,得到尾数矩阵中每一行数据对应的前导零的数量;基于每一行数据对应的前导零的数量,得到尾数矩阵中的各比特组;根据尾数矩阵中的各比特组,对待编码数据进行编码,得到目标编码数据。采用本方法能够有效提高嵌入式编码的编码速率。
-
公开(公告)号:CN119781673A
公开(公告)日:2025-04-08
申请号:CN202411779168.7
申请日:2024-12-05
Applicant: 湖南大学
Abstract: 本申请实施例提供了一种利用退火模拟算法生成数据‑编码映射序列的方法和装置,它模拟物理退火过程,从某一较高的初始温度出发,随着温度的不断下降,以一定概率突跳在全局进行寻优,并最终趋于全局最优。搜索过程中趋于零概率的突跳特性可有效避免算法陷入局部最优。因此,在寻找较优的编码映射方案的前提下,能够降低计算量。
-
公开(公告)号:CN118568300A
公开(公告)日:2024-08-30
申请号:CN202410632283.5
申请日:2024-05-21
Applicant: 湖南大学
IPC: G06F16/901
Abstract: 本申请涉及一种图形计算中强联通分量检测方法、装置、设备及介质,其中,方法包括:获取初始有向图中顶点个数、各顶点的出度、以及顶点平均度数;根据所述各顶点的出度以及所述顶点平均度数,确定目标枢轴;将所述目标枢轴的传入和传出标签初始化为所述顶点个数加1,得到新增虚拟顶点的目标有向图;采用ECL‑SCC算法对所述目标有向图进行SCC检测。整个过程中,先确定初始有向图中的目标枢轴,基于目标枢轴来新增虚拟顶点,在后续ECL‑SCC算法中即可根据最大标签传播的特性将枢轴所在的SCC移除,显著减少后续ECL‑SCC算法迭代的次数,实现高效的图形计算中强联通分量检测。
-
公开(公告)号:CN116757913A
公开(公告)日:2023-09-15
申请号:CN202310806134.1
申请日:2023-07-03
Applicant: 湖南大学
Abstract: 本申请涉及一种矩阵数据的处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:将待处理矩阵数据加载到图形处理器的共享内存中;根据图形处理器中的流处理器对待处理矩阵数据进行乘法处理,得到待处理矩阵数据的中间产物,根据预设表格的列号和中间产物中元素的列号进行查找,得到待处理矩阵的处理结果,其中,处理结果在共享内存中所占空间大小小于等于中间产物在共享内存中所占空间大小,将待处理矩阵的处理结果进行累加,得到目标矩阵数据,将目标矩阵数据返回至全局内存。该方法,通过对中间产物中元素直接进行查找,所得到的处理结果所占空间较小,进而释放一部分共享内存,提高了共享内存利用率。
-
公开(公告)号:CN116055003A
公开(公告)日:2023-05-02
申请号:CN202310012870.X
申请日:2023-01-05
Applicant: 湖南大学
Abstract: 本申请涉及一种数据最优传输方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待传输数据的数据传输矩阵;对数据传输矩阵中的每一行的行数据依次交织执行列重缩放操作与行重缩放操作,得到更新后的数据传输矩阵,并将每一行的行数据中经过行重缩放操作的行数据添加至预设列求和数组的相应位置中;将更新后的数据传输矩阵与更新前的数据传输矩阵进行比较,若比较结果满足预设迭代阈值,则将更新后的数据传输矩阵确定为目标数据传输矩阵;根据目标数据传输矩阵完成数据最优传输操作。采用本方法能够提高数据传输时内存访问速率以及内存计算单元利用率。
-
公开(公告)号:CN116055003B
公开(公告)日:2024-07-12
申请号:CN202310012870.X
申请日:2023-01-05
Applicant: 湖南大学
Abstract: 本申请涉及一种数据最优传输方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待传输数据的数据传输矩阵;对数据传输矩阵中的每一行的行数据依次交织执行列重缩放操作与行重缩放操作,得到更新后的数据传输矩阵,并将每一行的行数据中经过行重缩放操作的行数据添加至预设列求和数组的相应位置中;将更新后的数据传输矩阵与更新前的数据传输矩阵进行比较,若比较结果满足预设迭代阈值,则将更新后的数据传输矩阵确定为目标数据传输矩阵;根据目标数据传输矩阵完成数据最优传输操作。采用本方法能够提高数据传输时内存访问速率以及内存计算单元利用率。
-
公开(公告)号:CN117608824A
公开(公告)日:2024-02-27
申请号:CN202311469268.5
申请日:2023-11-07
Applicant: 湖南大学
IPC: G06F9/50
Abstract: 本申请涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:根据初始稀疏矩阵确定待分块的目标稀疏矩阵;从目标稀疏矩阵中确定起始列向量和终止列向量,起始列向量到终止列向量之间的列向量的数量小于或等于第一数量;获取起始列向量中未生成数据块的非零元素的数量,得到对比数量;针对起始列向量到终止列向量中每个列向量,按照从小到大的行顺序,从列向量中获取至少一个未生成数据块的非零元素,生成数据块;按照生成的顺序,从生成的各个数据块中确定待处理的数据块;将待处理的数据块中的非零元素均匀加载到线程束中列向量对应的线程中。采用本方法能够提高数据处理效率。
-
公开(公告)号:CN116880979A
公开(公告)日:2023-10-13
申请号:CN202310840878.5
申请日:2023-07-10
Applicant: 湖南大学
Abstract: 本申请涉及一种任务事件调度方法、装置、计算机设备、存储介质和计算机程序产品。方法包括:获取待执行任务,待执行任务中包括待执行事件、以及时间约束;获取执行节点执行待执行事件的预计执行时间、执行概率、以及预计资源开销;若预计执行时间满足时间约束,则根据执行概率、以及预计资源开销,构建候选事件序列;根据候选事件序列生成标识比特位,并将标识比特位进行组合,得到二进制字符串;根据二进制字符串对候选事件序列进行去冗余处理,得到目标事件序列;根据目标事件序列调用执行节点,执行待执行事件。方案有效地避免漏算事件序列而导致产生较大误差,提高了待执行任务或事件分配调度的准确性。
-
-
-
-
-
-
-
-