深度卷积的在线计算部件
    21.
    发明公开

    公开(公告)号:CN112632459A

    公开(公告)日:2021-04-09

    申请号:CN202011525795.X

    申请日:2020-12-22

    Abstract: 本发明公开一种深度卷积的在线计算部件,包括标准卷积部件、累加器和连接于累加器数据输出接口上的深度卷积部件;所述深度卷积部件包括若干级激活值站台、若干个乘法器、若干个权重值站台和至少一个设置于2个相邻激活值站台之间的延迟站台,每一个乘法器配备1个激活值站台和1个权重值站台,延迟站台的延迟值D等于输入激活图的宽度,权重值在卷积计算开始之前预先置位,激活值站台采用逐级推进的方式注入运算部件,每一级激活值站台中当前存放的结果送到下一级激活值站台。本发明在不破坏累加器输出数据结构的前提下,高效地完成了深度卷积计算,可以很大程度提高深度卷积运算的计算资源利用率,加速整个神经网络的运算速度。

    一种图像检测模型的高效全整数量化方法

    公开(公告)号:CN112508125A

    公开(公告)日:2021-03-16

    申请号:CN202011529800.4

    申请日:2020-12-22

    Abstract: 本发明公开一种目标检测模型的高效全整数量化方法,所述图像检测模型中各层卷积的权值、偏置、输入特征图和输出特征图均采用整数表示,量化推理过程均采用整数计算,具体包括以下步骤:对实数版本的图像检测模型进行正常训练、量化感知训练、量化参数生成、应用生成的各层参数,在计算设备上进行基于全整数运算的推理。本发明可以大大减少图像检测模型的推理时间,减少模型在磁盘存储和内存占用方面的空间,同时保持图像检测模型的高检测精度,有助于在FPGA等计算设备上实现更加高效的图像目标检测系统。

    输入输出能力增强的可重构微服务器

    公开(公告)号:CN103034295B

    公开(公告)日:2015-08-12

    申请号:CN201210575825.7

    申请日:2012-12-26

    Abstract: 一种输入输出能力增强的可重构微服务器,包括:微处理器、系统总线、内存、可重构加速部件以及输入输出外设;其中,微处理器、内存和输入输出外设连接至系统总线;微处理器直接连接至可重构加速部件;可重构加速部件包括:可重构运算加速模块、多个可重构I/O增强单元、以及与可重构I/O增强单元中的每一个单独连接的多个I/O控制器;其中,多个可重构I/O增强单元连接至可重构运算加速模块和系统总线;而且其中,可重构I/O增强单元中的每一个的对应的多个I/O控制器连接至具有相同资源类型的I/O设备,由此可重构I/O增强单元中的每一个及其对应的多个I/O控制器用于控制与具有相同资源类型的I/O设备之间的数据交换。

    多处理器系统的通信仿真方法、引擎及系统

    公开(公告)号:CN102760114B

    公开(公告)日:2015-07-08

    申请号:CN201110110825.5

    申请日:2011-04-29

    Abstract: 一种多处理器系统的通信仿真方法、引擎及系统,所述方法包括:创建多个仿真进程,每一个仿真进程对所述多处理器系统中的一个处理器进行仿真;获取所述多处理器系统中发送端处理器发出的通信消息,对所述发送端处理器的发送过程进行仿真,将所述通信消息转换为网络数据包;基于所述仿真进程之间的通信机制将所述网络数据包传输至对接收端处理器进行仿真的仿真进程;对所述接收端处理器的接收过程进行仿真,将所述网络数据包拆解为通信消息并将其传输至所述接收端处理器。本发明提高了通信仿真过程的可复用性。

    基于分布式系统的智能数据服务方法

    公开(公告)号:CN102937964B

    公开(公告)日:2015-02-11

    申请号:CN201210372403.X

    申请日:2012-09-28

    Abstract: 本发明提供了一种基于分布式系统的智能数据服务方法。利用分布式系统的主节点管理全局文件命名空间;并且,在向分布式系统写入文件的流程、从分布式系统读取文件的流程、以及从分布式系统读取文件的流程中,利用分布式系统的主节点对客户端的请求进行分析处理,选择具体的数据预处理程序,分发到分布式系统的从节点以进行后续的数据预处理和传输操作。本发明能够在数据密集型应用环境下,将现有的分布式系统存储空间快速聚合;而且,本发明充分利用分布式系统计算资源,能够根据外部计算设备的需求智能地提供数据服务;并且,本发明将部分数据处理负载从外部计算设备转移到分布式系统中,从而减少向外部计算设备提供数据服务的带宽需求。

    通信轨迹扩展方法及装置、通信轨迹驱动模拟方法及系统

    公开(公告)号:CN102760085B

    公开(公告)日:2014-10-22

    申请号:CN201110110818.5

    申请日:2011-04-29

    Abstract: 一种通信轨迹扩展方法及装置,所述方法包括:提取一个运行规模上运行的应用程序的每个进程的原始通信轨迹文件;匹配所述原始通信轨迹文件中原子事件的属性,确定各原子事件间的语法关系,根据所述语法关系将各原子事件组织形成语法事件序列;确定所述语法事件序列中各语法事件的含义以及相互关系,按照各语法事件的相互关系构造成算法事件;将所述应用程序在多个不同运行规模上多次运行,形成多个算法事件;确定多个算法事件之间的关系,其体现通信轨迹与进程数之间以及通信轨迹与进程间拓扑之间的关系;基于多个算法事件之间的关系生成所述应用程序在目标规模上运行的目标通信轨迹文件。本发明实施方式还提供一种通信轨迹驱动模拟方法及系统。

    基于阵列结构的处理器核心的通信方法及通信装置

    公开(公告)号:CN102446157B

    公开(公告)日:2013-09-18

    申请号:CN201010508839.8

    申请日:2010-10-12

    Abstract: 一种基于阵列结构的处理器核心的通信方法及通信装置。所述基于阵列结构的处理器核心的通信方法包括:发送端处理器核心获取数据发送指令并进行解析;基于所述数据发送指令的解析结果,所述发送端处理器核心从其通用寄存器文件中获取数据,并将所述数据存储到其发送缓冲单元中;发送端处理器核心将其发送缓冲单元中的数据发送至所述数据发送指令指示的目标处理器核心的接收缓冲单元;目标处理器核心获取数据接收指令并进行解析;基于所述数据接收指令的解析结果,所述目标处理器核心从其接收缓冲单元中获取数据,并将数据存储到其通用寄存器文件中。

    基于嵌入式处理器存储接口的集群计算系统混合通信方法

    公开(公告)号:CN102904943A

    公开(公告)日:2013-01-30

    申请号:CN201210372418.6

    申请日:2012-09-28

    Abstract: 本发明提供了一种基于嵌入式处理器存储接口的集群计算系统混合通信方法。将嵌入式处理器集成的网络控制器通过网络收发器连接至第一网络。将并行存储接口通过混合网络通信模块连接至第二网络。当并行接口状态机从与并行存储接口连接的存储总线接收到数据时,将数据存放到发送队列。利用接收控制逻辑从第二网络接收到数据包并拆解数据包,然后根据数据包的目的地址,选择将数据包存放到接收队列或转发队列,其中接收队列缓存待转发至并行存储接口的数据。当接收队列非空,且与并行存储接口连接的存储总线未占用时,将数据发送到存储总线上。利用发送控制逻辑对发送队列和转发队列进行仲裁,基于年龄策略选择最老年龄的数据包进行发送。

    通信轨迹扩展方法及装置、通信轨迹驱动模拟方法及系统

    公开(公告)号:CN102760085A

    公开(公告)日:2012-10-31

    申请号:CN201110110818.5

    申请日:2011-04-29

    Abstract: 一种通信轨迹扩展方法及装置,所述方法包括:提取一个运行规模上运行的应用程序的每个进程的原始通信轨迹文件;匹配所述原始通信轨迹文件中原子事件的属性,确定各原子事件间的语法关系,根据所述语法关系将各原子事件组织形成语法事件序列;确定所述语法事件序列中各语法事件的含义以及相互关系,按照各语法事件的相互关系构造成算法事件;将所述应用程序在多个不同运行规模上多次运行,形成多个算法事件;确定多个算法事件之间的关系,其体现通信轨迹与进程数之间以及通信轨迹与进程间拓扑之间的关系;基于多个算法事件之间的关系生成所述应用程序在目标规模上运行的目标通信轨迹文件。本发明实施方式还提供一种通信轨迹驱动模拟方法及系统。

Patent Agency Ranking