一种卷积神经网络加速器
    91.
    发明授权

    公开(公告)号:CN109543140B

    公开(公告)日:2020-07-10

    申请号:CN201811214310.8

    申请日:2018-10-18

    Inventor: 李晓维 魏鑫 路航

    Abstract: 本发明涉及一种卷积神经网络加速器,包括:将原始权重按计算顺序排列并按位对齐,得到权重矩阵,剔除权重矩阵中的松弛位,得到具有空位的精简矩阵,并使得精简矩阵的每一列中的基本位按计算顺序递补空位,得到中间矩阵,剔除中间矩阵中的空行,并将中间矩阵的空位置0,得到捏合矩阵,捏合矩阵的每一行作为捏合权重;根据激活值与原始权重中基本位的对应关系,得到捏合权重中每一位对应激活值的位置信息;将捏合权重送入拆分累加器,拆分累加器将捏合权重按位分割为多个权重段,根据位置信息,将权重段与对应的激活值进行求和处理,并将处理结果发送至加法树,通过对处理结果执行移位相加,得到输出特征图。

    一种异构系统的带宽利用率提升方法及系统

    公开(公告)号:CN110958183A

    公开(公告)日:2020-04-03

    申请号:CN201911018027.2

    申请日:2019-10-24

    Abstract: 本发明提出一种异构系统的带宽利用率提升方法及系统,包括:获取包含CPU和加速器核心的异构系统,其中CPU通过高速互联接口与加速器相连;获取带宽资源利用率的性能,根据性能确定带宽充分利用时数据包大小的阈值;按序从任务缓存池中获取待执行任务作为当前任务,判断当前任务的数据量是否小于阈值,若是,则将当前任务作为小数据包,按照任务缓存池中任务顺序依次提取待执行任务,并通过带宽累加器和小数据包累加,得到累加数据包,直到累加数据包大小大于等于阈值,将当前累加数据包打包发送至加速器核心,否则将当前任务作为大数据包,大数据包通过与阈值的比较,进行任务拆分,得到多个拆分结果,将多个拆分结果依次打包,发送至加速器核心。

    数据中心的服务器性能评估及服务器更新方法

    公开(公告)号:CN105786681B

    公开(公告)日:2019-03-26

    申请号:CN201610091361.0

    申请日:2016-02-18

    Abstract: 本发明提供一种数据中心的服务器性能评估方法,包括:1)对于任意服务器类型i,获取各个应用u运行在该服务器类型i上所体现的性能;2)基于数据中心的历史数据,计算各个应用u在服务器类型i上体现的权重;3)基于步骤2)所得的权重,计算各个应用u运行在该服务器类型i上所体现的性能的加权和,从而得到服务器类型i对于数据中心的性能期望。本发明还提供了相应的数据中心的服务器更新方法。本发明的服务器性能评估模型能够对应用的性能期望进行准确的预测,且数据采集与决策时间开销小;能够快速给出基于成本效益最优化的数据中心的服务器更新方案;能够节约成本,且便于实施。

    一种基于集成学习的差错控制方法和系统

    公开(公告)号:CN108537343A

    公开(公告)日:2018-09-14

    申请号:CN201810186544.X

    申请日:2018-03-07

    CPC classification number: G06F11/1479

    Abstract: 本发明涉及一种基于集成学习的差错控制方法,用于通过动态调整基学习器的执行数量实现最优收敛;其中所述集成学习的差错控制方法包括:训练步骤,对集成学习中各基学习器进行训练;回测步骤,确定各基学习器的评价指标,用于后续基学习器执行的优化;执行顺序优化步骤,根据评价指标确定各学习器执行的先后顺序;执行方式优化步骤,根据评价指标确定各学习器执行方式为串行或并行;收敛步骤,基学习器根据输入数据最快地终止执行,同时保证预测结果的准确性。本发明能够以最大程度地减少能耗开销,同时不损失差错控制质量,实现最优的能耗节省与实时性的平衡。

    一种高稳定性的强物理不可克隆函数电路及其设计方法

    公开(公告)号:CN105740731B

    公开(公告)日:2018-08-10

    申请号:CN201610074180.7

    申请日:2016-02-02

    Inventor: 李晓维 胡瑜 叶靖

    Abstract: 本发明适用于信息安全领域及集成电路领域,提供了一种高稳定性的强物理不可克隆函数电路及其设计方法,该物理不可克隆函数电路包括:时延生成模块,用于根据强物理不可克隆函数电路的输入激励,将同一跳变通过多条时延路径进行传播,同时产生多个时延值;时延比较模块,用于从多个时延值中选出多对时延值进行时延差比较,并将各对时延值的时延差按大小划分为多个等级;响应计算模块,用于根据各对时延值的时延差等级,计算强物理不可克隆函数电路的输出响应;稳定判别模块,用于根据各对时延值的时延差等级,判别激励响应对是否稳定。本发明在保证强物理不可克隆函数电路抗攻击性的同时,能够实时在线测量时延差,进而大幅度提高稳定性。

    一种面向非规则三维集成电路片上网络的路由方法及系统

    公开(公告)号:CN105577539B

    公开(公告)日:2018-08-10

    申请号:CN201610057261.6

    申请日:2016-01-27

    Abstract: 本发明提出一种面向非规则三维集成电路片上网络的路由方法及系统,该方法包括根据所述非规则三维集成电路片上网络的拓扑结构,判断采用基于汉密尔顿路径的容错路由算法路由数据包,或基于生成树的容错路由算法路由数据包;若采用基于所述汉密尔顿路径的容错路由算法路由数据包,根据源节点与目的节点的位置确定使用按照节点编号单调上升或单调下降的顺序进行路由容错;若采用基于所述生成树的容错路由算法路由数据包,则选择生成树根节点,根据根节点,以及源节点与目的节点的位置,选择传输路径完成所述数据包的传输。

    数据写入方法及装置
    97.
    发明授权

    公开(公告)号:CN103730155B

    公开(公告)日:2018-05-29

    申请号:CN201210381337.2

    申请日:2012-10-10

    CPC classification number: G11C13/0069

    Abstract: 本发明实施例提供数据写入方法及装置。该方法包括:获取待写入数据与存储器中已存储数据的绝对差值;判断所述绝对差值是否大于预设阈值;若判断为是,则将所述待写入数据写入所述存储器;否则,不执行数据写入操作。本发明实施例提供的数据写入方法及装置能够用于有效减少对存储器进行写操作的次数,从而降低所带来的不良效果。

    一种基于可编程器件的卷积神经网络加速方法与系统

    公开(公告)号:CN107392308A

    公开(公告)日:2017-11-24

    申请号:CN201710469354.4

    申请日:2017-06-20

    Abstract: 本发明涉及一种基于可编程器件的卷积神经网络加速方法与系统。包括:对卷积神经网络在可编程器件上的基本结构进行设计,分别建立计算资源、频率关于并行化参数的量化模型;在不同并行化参数下,对实际电压、温度、工艺偏差可达的最高时钟频率进行探索,建立实际可达最高频率与并行化参数的分析模型;以计算吞吐量为优化目标,根据所建立的量化模型与分析模型,对卷积神经网络的设计空间探索进行问题抽象,并采用一定的搜索算法求解出性能最优的并行化参数。本发明在保证加速器稳定性及可靠性的同时,能够利用商用设计工具针对电压、温度、工艺偏差所预留的时延裕度,从而进一步提升卷积神经网络加速器的性能。

    一种用于三维集成电路片上网络的路由器及路由方法

    公开(公告)号:CN104539547B

    公开(公告)日:2017-10-10

    申请号:CN201410647643.5

    申请日:2014-11-14

    Abstract: 本发明提供一种用于三维集成电路片上网络的路由器,包括路由分流子模块,第一交叉开关子模块和第二交叉开关子模块;所述路由分流子模块用于将来自路由器输入端口的数据包分配至所述第一交叉开关子模块或者第二交叉开关子模块,所述第一交叉开关子模块的输出端与所述路由器的一部分输出端口连接,所述第二交叉开关子模块的输出端与所述路由器的另一部分输出端口连接。本发明还提供了相应的用于三维集成电路片上网络的路由方法。本发明能在三维集成电路片上网络的路由器出现永久性故障的情况下保障通信的正常运行,并兼顾较高的通信性能,较高的可靠性和较低的系统开销。并且,本发明能够以低成本实现防死锁。

    任务分配方法、任务分配装置及片上网络

    公开(公告)号:CN104156267B

    公开(公告)日:2017-10-10

    申请号:CN201310177172.1

    申请日:2013-05-14

    CPC classification number: G06F9/5088 G06F9/5066 G06F15/7825

    Abstract: 本发明实施例提供一种任务分配方法、任务分配装置及片上网络,该方法包括:确定待处理任务所包含的线程数量,在多核处理器构成的片上网络中确定连续的、与线程数量相等数量的多个空闲处理器核对应的片上路由器构成的连续区域。若此区域为非矩形区域,则确定由此区域扩展的矩形区域,若扩展的矩形区域内与非空闲处理器核连接的每一个片上路由器的预测流量未超过预设门限值,则将待处理任务的多个线程分配给区域中的空闲处理器核。本发明实施例提供的任务分配方法,借助已分配任务的边界路由器将非矩形区域扩展成规则的矩形区域,由于在任务分配时结合了区域形状的灵活性并采用XY路由,从而避免硬件开销大、网络吞吐量低、系统利用率低等问题。

Patent Agency Ranking