一种面向数据密集型应用的动态可重构处理器

    公开(公告)号:CN113407483B

    公开(公告)日:2023-12-12

    申请号:CN202110703118.0

    申请日:2021-06-24

    Applicant: 重庆大学

    Inventor: 刘大江 朱蓉

    Abstract: 本发明提出一种面向数据密集型应用的动态可重构处理器,其中,方法包括:一种面向数据密集型应用的动态可重构处理器,动态可重构处理器包括一个处理单元阵列、一个片上多bank便签式存储器和一个配置存储器,处理单元阵列由m x n个处理单元PE以二维阵列的形式组成,m和n为正整数,其中,同一行PE连接到同一条总线上,每条总线通过一个交叉选择矩阵单元访问到便签式存储器中的m个bank。本申请提出的方法使得可重用数据高效的在处理单元阵列中流动,避免了相同存储位置数据的重复访问,从源头上减少数据访问量,使动态可重构处理器的循环流水性能得到很大的提升。

    一种基于端到端学习的空间加速器映射方法

    公开(公告)号:CN117408328A

    公开(公告)日:2024-01-16

    申请号:CN202311150708.0

    申请日:2023-09-06

    Applicant: 重庆大学

    Inventor: 刘大江 夏余鑫

    Abstract: 本发明提出一种基于端到端学习的空间加速器映射方法,包括,S101:通过GCN网络模型提取数据流图DFG和粗粒度可重构计算阵列资源图TERG的信息作为输入状态S;S102:获取GCN网络模型输出动作A;S103:通过路由环境根据动作A识别数据流图中每条边的路由路径,并输出奖励R;S104:在奖励R的指导下,通过对GCN网络模型进行调整;S105:重复S101‑S104,直到找到有效的映射为止。本发明提出的方法,通过反向映射的端到端强化学习提供了高质量和可移植的映射方法。

    一种神经网络张量算子组合自动调优方法及装置

    公开(公告)号:CN116090521A

    公开(公告)日:2023-05-09

    申请号:CN202310153435.9

    申请日:2023-02-22

    Applicant: 重庆大学

    Inventor: 刘大江 雷磊

    Abstract: 本申请提出了一种神经网络张量算子组合自动调优方法及装置,涉及深度神经网络领域,包括:定义张量算子组合的计算方式,依次获取归约迭代空间与偏置迭代空间的循环分块大小;基于循环分块大小,根据调度模版对张量算子组合进行循环分块与循环合并优化,生成草图并对草图进行注释;根据自动调优模块处理注释后的草图,输出张量算子组合的调优参数。本申请通过生产消费关系数据域尺寸计算和数据对齐的循环分块比例计算,对算子组合进行分块大小有比例关系的循环分块,消除生产者消费者之间不匹配的冲突,提升了有数据依赖关系的算子组合加速任务的性能,并利用Ansor定制算子依赖关系的搜索空间,实现算子融合和减少冗余计算。

    基于元路径子图的异质图信息提取方法和装置

    公开(公告)号:CN113569906A

    公开(公告)日:2021-10-29

    申请号:CN202110649772.8

    申请日:2021-06-10

    Applicant: 重庆大学

    Abstract: 本申请提出了一种基于元路径子图的异质图信息提取方法,涉及异质图信息提取技术领域,其中,该方法包括:通过异质属性转换,将异质图包含的节点的属性映射到同一特征空间,生成对应的特征向量;根据元路径类别的不同对异质图进行分解,生成同质子图和异质子图;分别对同质子图和异质子图中节点的特征向量进行卷积,生成目标节点在不同子图中的特征表示;对目标节点在不同子图中的特征表示按照相应的权重进行融合,获取到每个节点的多重语义和多种子图结构。本发明可以很好地捕获同质邻居和异质邻居的结构、语义和属性信息,能够提供更加完善的节点特征表示,能够用于广泛的机器学习和图数据挖掘任务。

    面向稀疏矩阵向量乘计算的软硬件协同设计方法和框架

    公开(公告)号:CN118245110A

    公开(公告)日:2024-06-25

    申请号:CN202311757741.X

    申请日:2023-12-19

    Applicant: 重庆大学

    Inventor: 刘大江 田明浩

    Abstract: 本申请提出了一种面向稀疏矩阵向量乘计算的软硬件协同设计方法,涉及计算机体系结构技术领域,其中,该方法包括:根据矩阵参数和设备参数定义可扩展的压缩数据格式;评估不同的参数组合在矩阵上的性能,确定最优参数组合,其中,最优参数组合包括批次高度H、批次宽度W、组大小N、端口数量P;基于最优参数组合,根据预定义的模板确定硬件参数,并确定对应的SpMV加速器;基于最优参数组合和定义的可扩展的压缩数据格式,使用重排序算法对矩阵和对应的向量进行数据打包,生成压缩存储数据并在SpMV加速器上执行,完成矩阵向量的乘计算。采用上述方案的本发明能够有效提升SpMV任务的带宽利用率。

    一种基于乱迭代序可重构处理器的数据处理方法

    公开(公告)号:CN117827291A

    公开(公告)日:2024-04-05

    申请号:CN202311844843.5

    申请日:2023-12-28

    Applicant: 重庆大学

    Inventor: 刘大江 梁跃

    Abstract: 本发明提出一种基于乱迭代序可重构处理器的数据处理方法,包括,构建基于乱序迭代执行的动态可重构处理器;将应用伪代码中的内存访问算子L0、L1、L2进行标注;其中,L0表示加载算子A[i][j],L1表示加载算子A[k][i],L2表示加载算子A[k][j];L0、L1、L2三个算子串行执行,并且分别布局在所述动态可重构处理器的访存单元LSU0、LSU1、LSU2上;基于所述动态可重构处理器执行乱序迭代,其中所述乱序迭代以流水线方式工作,包括4个阶段:取迭代、发射、执行和写回。通过本发明提出的方法,可从源头上解决非模板计算无法内存划分的问题,从而提升可重构处理器的并行数据访存能力。

    一种数据处理方法以及设备

    公开(公告)号:CN110334436B

    公开(公告)日:2023-11-07

    申请号:CN201910594905.9

    申请日:2019-07-03

    Abstract: 本申请实施例公开一种数据处理方法以及设备,其中方法包括如下步骤:获取数据流图中的节点算子的属性信息;所述属性信息包括所述节点算子的算子标签、所述节点算子的算子类型和所述节点算子的节点连接信息;根据所述节点算子的算子标签、所述节点算子的算子类型和所述节点算子的节点连接信息分别生成每个所述节点算子对应的算子向量;根据所述算子向量生成每个节点算子对应的算子时间控制步;所述算子时间控制步用于确定所述节点算子的算子调度顺序。采用本申请,可以提高资源的复用性,降低计算复杂度。

    融合三元组损失和生成对抗网络的多标签图像检索方法

    公开(公告)号:CN110321957B

    公开(公告)日:2023-03-24

    申请号:CN201910605728.X

    申请日:2019-07-05

    Abstract: 本发明提供了一种融合三元组损失和生成对抗网络的多标签图像检索方法,其包括步骤:搭建深度学习框架,部署生成对抗网络模型;输入图像数据集至生成对抗网络模型中以获取多标签图像和三元组数据;基于多标签图像构建三元组损失函数;从图像数据集中选取第一图像对深度哈希编码网络进行训练以获取完成训练的深度哈希编码网络;从图像数据集中选取预设数量的第二图像,将第二图像输入完成训练的深度哈希编码网络以获取哈希向量数据库;将需要检索的第一图像输入完成训练的深度哈希编码网络以检索出与第一图像相似的第二图像。本发明通过使用生成对抗网络生成与数据集样本相似的多标签生成图片,扩充了训练数据量,提高了图像的检索速度和精度。

    基于图卷积和强化学习的可重构计算架构映射方法和装置

    公开(公告)号:CN115757264A

    公开(公告)日:2023-03-07

    申请号:CN202211372089.5

    申请日:2022-11-03

    Applicant: 重庆大学

    Inventor: 刘大江 庄研

    Abstract: 本申请提出了一种基于图卷积和强化学习的可重构计算架构映射方法,包括:获取数据依赖图和粗粒度可重构阵列,并计算得到数据依赖图的最小启动间隔,根据最小启动间隔对数据依赖图进行预处理,根据粗粒度可重构阵列的结构,精简得到硬件模型资源图,将硬件模型资源图的节点集合作为动作空间,采用基于图卷积网络的强化学习模型对预处理后的数据依赖图进行映射,得到硬件模型资源图上的数据依赖图节点的映射结果,计算映射结果的奖励值,并在根据奖励值判断映射结果满足成功映射条件时,输出映射结果。本申请利用图卷积和强化学习优化循环在可重构计算阵列上的布局布线,提升循环执行的并行度,从而增加了映射质量,降低了图像去噪的执行时间。

    一种面向粗粒度可重构阵列上的路由增强调度方法及装置

    公开(公告)号:CN113569519A

    公开(公告)日:2021-10-29

    申请号:CN202110684520.9

    申请日:2021-06-21

    Applicant: 重庆大学

    Inventor: 刘大江 母松

    Abstract: 本发明提出一种面向粗粒度可重构阵列上的路由增强调度方法及装置,其中,方法包括:分析增强数据流图DFG中每个算子的可扩展机动性范围根据可扩展机动性范围定义整数线性规划模型的变量,根据变量构建整数线性规划模型中的约束条件,其中,整数线性规划模型的变量包括二进制变量和整数变量;根据变量构建整数线性规划模型中的约束条件以及构建的线性评估函数,获取全局最优解;根据全局最优解生成携式设备供电的嵌入式系统的调度方案。本申请提出的方法增强了数据流图的路由能力,提升了循环流水的性能。

Patent Agency Ranking