一种神经网络加速器及其运算方法

    公开(公告)号:CN105892989A

    公开(公告)日:2016-08-24

    申请号:CN201610183040.3

    申请日:2016-03-28

    CPC classification number: G06F7/575

    Abstract: 本发明适用于神经网络算法领域,提供了一种神经网络加速器及其运算方法,该神经网络加速器包括片内存储介质、片内地址索引模块、核心计算模块以及多ALU装置,片内存储介质,用于存储外部传来的数据或用于存储计算过程中产生的数据;片内数据索引模块,用于执行运算时根据输入的索引映射至正确的存储地址;核心计算模块用于执行神经网络运算;多ALU装置用于从核心计算模块或片内存储介质获取输入数据执行核心计算模块无法完成的非线性运算。本发明在神经网络加速器中引入多ALU设计,从而提升非线性运算的运算速度,使得神经网络加速器更加高效。

    加法器装置、数据累加方法及数据处理装置

    公开(公告)号:CN105512724A

    公开(公告)日:2016-04-20

    申请号:CN201510863726.2

    申请日:2015-12-01

    CPC classification number: G06F7/50 G06N3/06

    Abstract: 本发明公开一种加法器装置、数据累加方法及数据处理装置,所述加法器装置包括:第一加法器模块,具有由多级加法器阵列构成的加法树单元和第一控制单元,加法树单元基于第一控制单元的控制信号采用逐级累加的方式累加数据;第二加法器模块,包括两输入加减操作单元和第二控制单元,对输入数据进行加法或减法运算;移位操作模块,用于对第一加法器模块的输出数据进行左移位操作;与操作模块,用于对移位操作模块的输出数据和第二加法器模块的输出数据进行与操作;控制器模块,用于控制第一加法器模块及第二加法器模块的数据输入,控制移位操作模块的移位操作,以及控制第一控制单元及第二控制单元的控制信号的发射。由此,实现数据快速累加。

    计数方法及装置
    23.
    发明授权

    公开(公告)号:CN107818343B

    公开(公告)日:2021-01-08

    申请号:CN201711037201.9

    申请日:2017-10-30

    Abstract: 本公开提供了一种计数方法,包括:对一深度神经网络进行预训练;利用标记图像对预训练后的所述深度神经网络进行重训练,得到二分类的目标检测神经网络;以及利用所述二分类的目标检测神经网络对待计数的图像中包含的计数目标物体进行计数。本公开还提供了一种计数装置。本公开计数方法及装置应用范围广,可针对任意计数对象进行计数,节省人力并且提供了更高的通用性。

    神经网络运算装置及应用其进行运算的方法

    公开(公告)号:CN108170640B

    公开(公告)日:2020-06-09

    申请号:CN201711452014.7

    申请日:2017-10-17

    Abstract: 本公开提供一种神经网络运算装置和方法,其中装置包括:运算部分,用于完成所述卷积运算,包含多个运算单元组,多个所述运算单元组呈X行Y列的阵列式分布,运算单元组间以S形方向和/或逆S形方向传递数据,其中X和Y分别为正整数;缓存,用于向所述运算单元组传送数据以及接收运算单元组运算后的数据。通过采用S形和逆S形在运算单元中完成数据的传递,从而能够有效加速神经网络运算的同时,降低了权值的反复读取和部分和反复存取所带来的访存功耗。

    一种神经网络的处理方法、系统

    公开(公告)号:CN105930902B

    公开(公告)日:2018-08-10

    申请号:CN201610240416.X

    申请日:2016-04-18

    CPC classification number: G06F15/78 G06N3/063

    Abstract: 本发明适用于计算机技术领域,提供了一种神经网络处理系统的处理方法、系统,该神经网络的处理系统包括由多个核心处理模块组成的多核心处理模块、片上存储介质、片内地址索引模块以及ALU模块,多核心处理模块用于执行神经网络运算中的向量乘加操作,ALU模块用于从所述多核心处理模块或片上存储介质获取输入数据执行多核心处理模块无法完成的非线性运算,其中多个核心处理模块共享片上存储介质以及ALU模块,或者多个核心处理模块具有独立的片上存储介质以及ALU模块。本发明在神经网络处理系统中引入多核设计,从而提升神经网络处理系统的运算速度,使得神经网络处理系统性能更高,更加高效。

    多输入多输出处理器流水线数据同步装置及方法

    公开(公告)号:CN105824604B

    公开(公告)日:2017-08-29

    申请号:CN201510824901.7

    申请日:2015-11-24

    CPC classification number: G06F9/38

    Abstract: 本发明公开一种多输入多输出处理器流水线数据同步装置及方法,所述装置包括:具有多个运算流水级的多输入多输出功能部件,通过执行对输入操作数的运算响应指令;流水线控制器,接收指令,解析指令所需的输入操作数并判断输入操作数的有效性,若全部有效,则发送指令进入功能部件,若至少一个无效,则发送空指令进入功能部件;流水线控制器接收功能部件的输出请求,并判断可行性,若可行,则在芯片的一个节拍周期内接收所述输出请求,并在一定时间内将输出请求转发至存储器,若不可行,则阻塞功能部件的输出。由此,不仅解决了多输入多输出功能部件的流水线同步化问题,同时能很大程度降低处理器访存开销,提高处理器的访存效率。

    片上重复寻址的方法及装置

    公开(公告)号:CN105912476A

    公开(公告)日:2016-08-31

    申请号:CN201610210095.9

    申请日:2016-04-06

    CPC classification number: G06F12/06 G06F12/0653 G06F12/0831

    Abstract: 本发明提供一种片上重复寻址的方法及其相应的装置,该方法包括:数据划分步骤,根据预定的数据划分原则将片上存储介质和/或片外存储介质的数据划分为不同的数据块,所述数据划分原则包括将重用距离低于预定距离阈值的数据划分在同一个数据块;数据索引步骤,根据预定的替换策略的顺序关系,依次载入不同的所述数据块到至少一个片上处理单元,被载入的所述数据块中的重复数据在片内重复寻址。本发明将重用距离小于预定的距离阈值的数据划分在同一个数据块,这些数据划分在同一数据块上可以一次载入片内存储然后使用尽可能多的次数,从而访存更加高效。

    一种异构多核线程调度方法、系统及异构多核处理器

    公开(公告)号:CN103294550B

    公开(公告)日:2016-08-10

    申请号:CN201310206533.0

    申请日:2013-05-29

    CPC classification number: Y02D10/22 Y02D10/24 Y02D10/36

    Abstract: 本发明涉及一种异构多核线程调度方法,包括根据程序的动态特征分别为线程和核生成排序列表,并根据排序列表找出线程和核的最优的稳定匹配,根据该稳定匹配进行线程调度。包括接收运行在该核的线程的特征向量,并据其为该线程给各个核进行选择一个优先级排序;为各个核对各个线程进行排序;接收各个线程和核的排序列表,并找出线程和核的稳定匹配结果;接收该匹配结果,通过操作系统进行调度,将各个线程分配到相应的核上运行。避免了抽样调度带来的巨大开销;将更多影响性能功耗的复杂因素考虑在内,只需要预测的相对关系而非具体值,降低了模型的复杂度的同时也提高了调度的精确性。

Patent Agency Ranking