-
公开(公告)号:CN117933302A
公开(公告)日:2024-04-26
申请号:CN202410154892.4
申请日:2024-02-02
Applicant: 上海交通大学
Abstract: 本发明涉及神经网络模型剪枝技术领域,尤其涉及基于蒸馏子图的图神经网络剪枝方法,包括以下步骤:S1:根据输入图中节点的邻接向量的相似性计算输入图中边的相似性生成稀疏化的蒸馏子图;S2:基于蒸馏子图对特征通道掩码和模型权重掩码进行剪枝,获得保留的节点特征向量和模型权重参数;S3:根据节点特征向量和模型权重参数进行重训练,得到最终模型权重值。本发明核心思想是先从原始的大尺寸输入图中,蒸馏提取一个保留了关键图结构信息的小尺寸稀疏子图,通过小尺寸的稀疏子图替代原始的大尺寸输入图进行剪枝,大幅减少剪枝过程中的计算与访存量,本发明通过提出节点特征和模型参数的协同剪枝技术,能够大幅降低节点特征和模型权重的参数量。
-
公开(公告)号:CN112612744A
公开(公告)日:2021-04-06
申请号:CN202011471974.X
申请日:2020-12-14
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于数据流解耦的可重构阵列映射方法,涉及可重构阵列的映射布局领域,首先,在原始DFG(Data Flow Graph,数据流图)中执行速率失配的区域间加入DE(Decouple Element,解耦单元),对数据流进行解耦;其次,利用一种“局部紧密,全局稀疏”的分簇式互连结构,将解耦后的所述数据流分隔在若干个规则的互连区域内;最后,通过一种分布式多阶段的布局算法,对每块所述互连区域内的所述数据流进行物理布局。本发明可以提高阵列的执行效率,完成了各种类型的单元的高效映射,并提升布局的速度和质量。
-
公开(公告)号:CN112698954A
公开(公告)日:2021-04-23
申请号:CN202110049464.1
申请日:2021-01-14
Applicant: 上海交通大学
IPC: G06F9/50
Abstract: 本发明提供了一种基于子图解耦的粗粒度可重构阵列调度方法,涉及计算机协处理器加速器领域,包括子图解耦模块、动态配置切换模块、子图调度器,其中,所述子图解耦模块是针对程序中的非一致性控制流,将数据流图解耦成子图依次执行;所述动态配置切换模块是设计了一种多米诺骨牌式的配置切换机制,降低动态配置切换的开销;所述子图调度器是通过监测片上缓存中子缓存(bank)的空满状态,对子图的执行顺序进行动态调度。利用本发明提供的算法,可以提高阵列计算单元(PE)利用率,降低子图切换的开销。
-
公开(公告)号:CN112698954B
公开(公告)日:2022-05-10
申请号:CN202110049464.1
申请日:2021-01-14
Applicant: 上海交通大学
IPC: G06F9/50
Abstract: 本发明提供了一种基于子图解耦的粗粒度可重构阵列调度方法,涉及计算机协处理器加速器领域,包括子图解耦模块、动态配置切换模块、子图调度器,其中,所述子图解耦模块是针对程序中的非一致性控制流,将数据流图解耦成子图依次执行;所述动态配置切换模块是设计了一种多米诺骨牌式的配置切换机制,降低动态配置切换的开销;所述子图调度器是通过监测片上缓存中子缓存(bank)的空满状态,对子图的执行顺序进行动态调度。利用本发明提供的算法,可以提高阵列计算单元(PE)利用率,降低子图切换的开销。
-
公开(公告)号:CN119905130A
公开(公告)日:2025-04-29
申请号:CN202510405579.8
申请日:2025-04-02
Applicant: 上海交通大学
Abstract: 本发明实施例提供了一种存储装置的自检测方法、自检测电路、存储装置及系统,涉及存储检测技术领域。存储装置的自检测方法,包括:在进入存储装置的自检测模式后,向时钟发生模块发送自检使能信号,并将自检命令数据发送至各分布式检测单元;时钟发生模块生成自检时钟信号发送至自检测模块以及各分布式检测单元;基于自检命令数据,获取用于对相对应的目标存储模块进行测试的测试相关数据,并基于测试相关数据对目标存储模块进行故障测试,得到目标存储模块的故障信息。本发明降低了自检测的功耗,提升了存储模块的自检测效率。
-
公开(公告)号:CN112612744B
公开(公告)日:2022-11-25
申请号:CN202011471974.X
申请日:2020-12-14
Applicant: 上海交通大学
Abstract: 本发明公开了一种基于数据流解耦的可重构阵列映射方法,涉及可重构阵列的映射布局领域,首先,在原始DFG(Data Flow Graph,数据流图)中执行速率失配的区域间加入DE(Decouple Element,解耦单元),对数据流进行解耦;其次,利用一种“局部紧密,全局稀疏”的分簇式互连结构,将解耦后的所述数据流分隔在若干个规则的互连区域内;最后,通过一种分布式多阶段的布局算法,对每块所述互连区域内的所述数据流进行物理布局。本发明可以提高阵列的执行效率,完成了各种类型的单元的高效映射,并提升布局的速度和质量。
-
-
-
-
-