-
公开(公告)号:CN114004353A
公开(公告)日:2022-02-01
申请号:CN202111161801.2
申请日:2021-09-30
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种减少光器件数量的光神经网络芯片构建方法和系统,通过芯片结构与训练方法协同的方法,通过低秩近似压缩光芯片中冗余光器件的数量,同时基于若干的优化手段,保证神经网络的识别准确率。本发明所提出的减少光器件数量的光神经网络芯片构建方法包括权重矩阵预处理、酉保持训练、器件剪枝和功能光器件网络构建。因此,本发明通过结构和算法的协同,在识别率基本保持不变的情况下,极大地降低光器件的使用数量。
-
公开(公告)号:CN109784485B
公开(公告)日:2021-04-23
申请号:CN201811598075.9
申请日:2018-12-26
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067
Abstract: 本发明提供一种光学神经网络处理器及其计算方法。所述处理器包括:数值映射装置、正值光学计算装置、负值光学计算装置、光电转换器、减法器、非线性激活装置。在计算时,将神经网络模型中网络层的权值和输入值映射到可由光神经元表示的整数域内,并分为正负两个光路进行网络层的计算,通过减法器将两路计算结果合并为一路。
-
公开(公告)号:CN110990063A
公开(公告)日:2020-04-10
申请号:CN201911191604.8
申请日:2019-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种用于基因相似性分析的加速装置、方法和计算机设备,该加速装置包括高速通信接口,用于与主机通信,接收主机分发的待加速处理的任务;序列缓存模块,用于缓存来自主机的一个或者多个任务,每个任务包含待进行基因相似性分析的多个基因序列数据;阵列处理机,其上设有用于处理任务的处理单元,处理单元中设有基于数据驱动的流式计算模式处理任务的完整流水线,流水线中配置有处理任务所需的多个定点计算部件;控制模块,其被配置为用于将序列缓存模块中的待处理的任务分配给处理单元;任务缓存模块,其上设置有任务缓存单元,用于缓存分配给处理单元的待处理任务。本发明能够提高基因相似性分析的效率,快速得到分析结果。
-
公开(公告)号:CN103413796A
公开(公告)日:2013-11-27
申请号:CN201310298425.0
申请日:2013-07-16
Applicant: 中国科学院计算技术研究所
IPC: H01L23/485 , H01L23/50 , H01L23/52 , H01L21/768
CPC classification number: H01L2224/16225 , H01L2924/15192 , H01L2924/15311
Abstract: 本发明提出基于多层布线基板多芯片集成的大端口互连类芯片互连构建与物理实现方法,提出适用于基板集成的多芯片互连结构与构建方法、多芯片布局、基板引脚阵列划分与分配、高速差分信号对引脚对分配、基板布线的有效分区与划分方法与相应的多芯片互连类芯片装置。本发明在基板封装尺度上,有效实现等效的大端口互连类芯片。与相应的单芯片集成实现方法相比,本发明方法可以支持多种互连结构,兼容多种微体系结构的互连子芯片,能有效的利用不同功能互连子芯片的特点,而在芯片实现的成本、可扩展性、灵活性、兼容性等方面具有更佳的兼顾性,同时对实现所需的集成电路制造技术要求更低,可同时提供不同端口数的、不同规格的互连芯片,在适应市场需求上,更为灵活。
-
公开(公告)号:CN110990063B
公开(公告)日:2021-11-23
申请号:CN201911191604.8
申请日:2019-11-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明实施例提供了一种用于基因相似性分析的加速装置、方法和计算机设备,该加速装置包括高速通信接口,用于与主机通信,接收主机分发的待加速处理的任务;序列缓存模块,用于缓存来自主机的一个或者多个任务,每个任务包含待进行基因相似性分析的多个基因序列数据;阵列处理机,其上设有用于处理任务的处理单元,处理单元中设有基于数据驱动的流式计算模式处理任务的完整流水线,流水线中配置有处理任务所需的多个定点计算部件;控制模块,其被配置为用于将序列缓存模块中的待处理的任务分配给处理单元;任务缓存模块,其上设置有任务缓存单元,用于缓存分配给处理单元的待处理任务。本发明能够提高基因相似性分析的效率,快速得到分析结果。
-
公开(公告)号:CN109376855B
公开(公告)日:2021-04-06
申请号:CN201811532813.X
申请日:2018-12-14
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067
Abstract: 本发明提供一种光神经元结构和包含该结构的神经网络处理系统。该神经元结构包括突触输入调制模块、突触权值调制模块、光线聚合模块和光强度探测模块,其中,突触输入调制模块用于接收光信号并在与输入神经元关联的电信号的控制下执行光路调制;突触权值调制模块用于在与权值关联的电信号控制下执行对所述承载输入神经元的光信号进行调制;光线聚合模块用于对多个突触权值调制模块的输出光信号进行聚合;光强度探测模块用于将来自于光线聚合模块的输出光信号转换为电信号并执行激活操作。本发明的光神经元结构和包含该结构的神经网络处理系统能够实现神经网络的快速计算。
-
公开(公告)号:CN109784485A
公开(公告)日:2019-05-21
申请号:CN201811598075.9
申请日:2018-12-26
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067
Abstract: 本发明提供一种光学神经网络处理器及其计算方法。所述处理器包括:数值映射装置、正值光学计算装置、负值光学计算装置、光电转换器、减法器、非线性激活装置。在计算时,将神经网络模型中网络层的权值和输入值映射到可由光神经元表示的整数域内,并分为正负两个光路进行网络层的计算,通过减法器将两路计算结果合并为一路。
-
公开(公告)号:CN110069441A
公开(公告)日:2019-07-30
申请号:CN201910216953.4
申请日:2019-03-21
Applicant: 中国科学院计算技术研究所
IPC: G06F15/177
Abstract: 本发明涉及一种用于流计算的FPGA网络,该FPGA网络由多个FPGA通信连接而成,用于处理用户数据以获取处理结果,其中该FPGA包括:计算逻辑单元组模块,用于进行数据处理以获得中间结果;控制逻辑模块,用于将用户数据传输给该计算逻辑单元组模块,并根据路由表,将该中间结果传输至下一个FPGA,或将该中间结果作为处理结果传输至该FPGA网络出口;通信模块,用于进行该FPGA的外部数据传输。本发明采用软硬件相互协同的方式进行工作,可以充分发挖掘大数据计算数据流中的并行成分,发挥FPGA高并行度的计算优势,大大降低流计算的计算延迟,提高推荐系统、计算广告等大数据应用事务的反馈速度。
-
公开(公告)号:CN109785905A
公开(公告)日:2019-05-21
申请号:CN201811546046.8
申请日:2018-12-18
Applicant: 中国科学院计算技术研究所
IPC: G16B30/00
Abstract: 本发明提供了一种面向基因比对算法的加速装置。该加速装置包括主机端和多个加速模块,所述加速模块包括多个存储层、垂直切片管理单元和交换网络,其中:所述主机端用于控制向所述加速模块分发基因测序序列和接收基因比对结果;所述加速模块的存储层用于存储基因参考序列;所述加速模块的垂直切片管理单元用于管理将所述多个存储层进行垂直划分所形成的切片以及执行基因比对算法,获得基因比对结果;所述加速模块的交换网络用于控制该加速模块内部的数据交换以及该加速模块与外部的数据交换。本发明的加速装置利用定制结构能够提高基因比对算法的处理速度。
-
公开(公告)号:CN114004353B
公开(公告)日:2025-02-28
申请号:CN202111161801.2
申请日:2021-09-30
Applicant: 中国科学院计算技术研究所
IPC: G06N3/067 , G06N3/0464 , G06N3/082 , G06N3/084
Abstract: 本发明提出一种减少光器件数量的光神经网络芯片构建方法和系统,通过芯片结构与训练方法协同的方法,通过低秩近似压缩光芯片中冗余光器件的数量,同时基于若干的优化手段,保证神经网络的识别准确率。本发明所提出的减少光器件数量的光神经网络芯片构建方法包括权重矩阵预处理、酉保持训练、器件剪枝和功能光器件网络构建。因此,本发明通过结构和算法的协同,在识别率基本保持不变的情况下,极大地降低光器件的使用数量。
-
-
-
-
-
-
-
-
-