-
公开(公告)号:CN109543830A
公开(公告)日:2019-03-29
申请号:CN201811214639.4
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种用于卷积神经网络加速器的拆分累加器,用于将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
公开(公告)号:CN109543816A
公开(公告)日:2019-03-29
申请号:CN201811214323.5
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于权重捏合的卷积神经网络计算方法和系统,包括:将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
公开(公告)号:CN109543140A
公开(公告)日:2019-03-29
申请号:CN201811214310.8
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种卷积神经网络加速器,包括:将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
公开(公告)号:CN113657595A
公开(公告)日:2021-11-16
申请号:CN202110960966.X
申请日:2021-08-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于硬件的神经网络实时剪枝方法、系统及神经网络加速器,包括获取神经网络模型中待矩阵乘的比特矩阵,并以比特矩阵比特行与比特列的欧氏距离乘积,作为该比特矩阵中各比特行在矩阵乘运算中的重要度;根据该重要度将比特矩阵的每个比特行划分位重要行或非重要行,并将该比特矩阵的非重要行中为1的比特位置零后得到的矩阵,作为该比特矩阵的剪枝结果。本发明为基于有效bit的剪枝方法,且本申请判断bit有效度的方法无需借助软件层面进行剪枝、独立于现有软件剪枝方法并且支持多精度DNN。
-
公开(公告)号:CN109543830B
公开(公告)日:2023-02-03
申请号:CN201811214639.4
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种用于卷积神经网络加速器的拆分累加器,用于将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
公开(公告)号:CN109543140B
公开(公告)日:2020-07-10
申请号:CN201811214310.8
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种卷积神经网络加速器,包括:将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
公开(公告)号:CN104156267B
公开(公告)日:2017-10-10
申请号:CN201310177172.1
申请日:2013-05-14
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5088 , G06F9/5066 , G06F15/7825
Abstract: 本发明实施例提供一种任务分配方法、任务分配装置及片上网络,该方法包括:确定待处理任务所包含的线程数量,在多核处理器构成的片上网络中确定连续的、与线程数量相等数量的多个空闲处理器核对应的片上路由器构成的连续区域。若此区域为非矩形区域,则确定由此区域扩展的矩形区域,若扩展的矩形区域内与非空闲处理器核连接的每一个片上路由器的预测流量未超过预设门限值,则将待处理任务的多个线程分配给区域中的空闲处理器核。本发明实施例提供的任务分配方法,借助已分配任务的边界路由器将非矩形区域扩展成规则的矩形区域,由于在任务分配时结合了区域形状的灵活性并采用XY路由,从而避免硬件开销大、网络吞吐量低、系统利用率低等问题。
-
公开(公告)号:CN104156267A
公开(公告)日:2014-11-19
申请号:CN201310177172.1
申请日:2013-05-14
Applicant: 华为技术有限公司 , 中国科学院计算技术研究所
IPC: G06F9/50
CPC classification number: G06F9/5088 , G06F9/5066 , G06F15/7825
Abstract: 本发明实施例提供一种任务分配方法、任务分配装置及片上网络,该方法包括:确定待处理任务所包含的线程数量,在多核处理器构成的片上网络中确定连续的、与线程数量相等数量的多个空闲处理器核对应的片上路由器构成的连续区域。若此区域为非矩形区域,则确定由此区域扩展的矩形区域,若扩展的矩形区域内与非空闲处理器核连接的每一个片上路由器的预测流量未超过预设门限值,则将待处理任务的多个线程分配给区域中的空闲处理器核。本发明实施例提供的任务分配方法,借助已分配任务的边界路由器将非矩形区域扩展成规则的矩形区域,由于在任务分配时结合了区域形状的灵活性并采用XY路由,从而避免硬件开销大、网络吞吐量低、系统利用率低等问题。
-
公开(公告)号:CN113657595B
公开(公告)日:2024-03-12
申请号:CN202110960966.X
申请日:2021-08-20
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于硬件的神经网络实时剪枝方法、系统及神经网络加速器,包括获取神经网络模型中待矩阵乘的比特矩阵,并以比特矩阵比特行与比特列的欧氏距离乘积,作为该比特矩阵中各比特行在矩阵乘运算中的重要度;根据该重要度将比特矩阵的每个比特行划分位重要行或非重要行,并将该比特矩阵的非重要行中为1的比特位置零后得到的矩阵,作为该比特矩阵的剪枝结果。本发明为基于有效bit的剪枝方法,且本申请判断bit有效度的方法无需借助软件层面进行剪枝、独立于现有软件剪枝方法并且支持多精度DNN。
-
公开(公告)号:CN109543816B
公开(公告)日:2022-12-06
申请号:CN201811214323.5
申请日:2018-10-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于权重捏合的卷积神经网络计算方法和系统,包括:将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。
-
-
-
-
-
-
-
-
-