-
公开(公告)号:CN113466890B
公开(公告)日:2024-04-09
申请号:CN202110590374.3
申请日:2021-05-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出了一种基于关键特征提取的轻量化激光雷达惯性组合定位方法和系统,包括:利用惯性预积分的中间变量补偿激光点云的运动畸变;提取激光雷达关键帧中的线、面特征,完成帧间特征匹配;定量地评估激光雷达特征匹配约束的有效性;剔除低效的特征约束;选定合适的回环检测时机,在保证精度的前提下,降低计算成本,实现三维点云的建图和高精度的定位、姿态估计。
-
公开(公告)号:CN117807935A
公开(公告)日:2024-04-02
申请号:CN202311808014.1
申请日:2023-12-26
Applicant: 中国科学院计算技术研究所
IPC: G06F30/337 , G06F111/06
Abstract: 本发明提出一种基于芯粒的芯片设计自动分解方法和系统,包括根据芯片的设计描述图,对设计描述图中块类型进行划分,得到初始的分解方案作为当前划分方案;对该当前划分方案中分组进行调整;遍历被调整分组的候选芯粒集合的笛卡尔积,选择使该芯片目标函数最小的芯粒划分方案作为扰动方案;根据扰动前后的目标函数,进行基于模拟退火的芯片设计分解,得到最优芯粒设计。本发明自动地根据性能、成本等模型,自动地去找最好的芯粒方案。
-
公开(公告)号:CN116627894A
公开(公告)日:2023-08-22
申请号:CN202310893529.X
申请日:2023-07-20
Applicant: 之江实验室 , 中国科学院计算技术研究所
IPC: G06F15/78
Abstract: 本申请涉及一种介质访问控制层、通信方法和系统,其中,介质访问控制层包括:数据链路协议桥模块,用于建立所述片内通信接口和所述片间通信接口之间的逻辑数据链路;介质访问控制器模块,用于将所述片内通信接口数据编码为所述片间通信接口的规格所对应的帧数据,并将所述帧数据传输至所述片间通信接口;配置模块,用于接收并解析所述数据链路协议桥模块传输的配置包,以配置所述片间通信接口。本申请解决了介质访问控制层无法兼容市面上的各种不同规格的片间通信接口,导致无法复用的问题。
-
公开(公告)号:CN116451754A
公开(公告)日:2023-07-18
申请号:CN202310310363.4
申请日:2023-03-24
Applicant: 中国科学院计算技术研究所
IPC: G06N3/063 , G06N3/0464 , G06N3/048 , G06F9/48
Abstract: 本发明提供了一种支持多层神经网络的层间并行处理的加速器,包括:计算阵列;用于获取一个或者多个数据块上存储的多层神经网络中,已可用于后续计算的层内和/或层间数据作为重组数据并重组成预设重组粒度的重组数据矩阵以及获取对重组数据矩阵处理所需的网络参数并重排成重组权重矩阵的第一重排器;用于在计算阵列处理重组矩阵时获取重组数据矩阵对应的预设重组粒度,指示计算阵列中各处理单元按照预设重组粒度获取重组数据矩阵中的数据和重排权重矩阵中对应的权重进行处理的扩展模块;用于在计算阵列对所述重组数据矩阵处理完成后,根据处理各数据得到的结果按结果原始形式进行结果重组以还原网络层的输出的第二重组器。
-
公开(公告)号:CN116417423A
公开(公告)日:2023-07-11
申请号:CN202310122230.4
申请日:2023-01-19
Applicant: 之江实验室 , 中国科学院计算技术研究所
IPC: H01L23/473 , H01L23/367
Abstract: 本发明涉及一种冷却液分流板及芯片冷却结构,包括板体和导流板;所述板体正面中间内凹形成流动槽,所述板体边缘开设有总进液口和总出液口,所述流动槽的底壁上开设有冷却口;所述导流板设置在所述流动槽的底壁上并阻隔在所述总进液口和所述总出液口之间,以在所述流动槽中分隔出进液通道和出液通道,所述进液通道连通至所述总进液口,所述出液通道连通至所述总出液口;所述导流板包括若干蛇形板,所述蛇形板盖合在所述冷却口上,所述蛇形板的一侧凹口为第一进液凹口,所述蛇形板的另一侧凹口为第一出液凹口,所述第一进液凹口连通至所述进液通道,所述第一出液凹口连通至所述出液通道。本发明整个芯粒的散热相对均匀。
-
公开(公告)号:CN116225532A
公开(公告)日:2023-06-06
申请号:CN202310219286.1
申请日:2023-03-07
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种支持加速向量运算的通用处理器,该通用处理器包括CPU,该通用处理器还包括一个或者多个向量运算模块,每个向量运算模块被配置为:从CPU获取对待处理的向量运算的指示信息,所述指示信息包括数据位宽和向量维度;根据所述指示信息中的数据位宽和向量维度调整向量运算模块对待处理的向量运算中数据的读取和计算方式,以在支持可配置数据位宽和向量维度的情况下利用向量运算模块完成向量运算。
-
公开(公告)号:CN115906943A
公开(公告)日:2023-04-04
申请号:CN202211511675.3
申请日:2022-11-29
Applicant: 中国科学院计算技术研究所
IPC: G06N3/0464 , G06N3/063 , G06N3/08
Abstract: 本发明提供了一种用于神经网络加速器的存储介质的数据管理方法,所述存储介质包括主存,所述方法包括:获取待加速的基于神经网络的模型的结构信息和指令信息;根据所述结构信息和指令参数,在所述存储介质中划分出专用存储区域用以存储所述模型对应的指令和数据;其中,所述专用存储区域包括:指令区,用于存储加速器对模型进行加速运算所需的指令;数据堆叠区,用于存储相应层输出的将在间隔的其他层使用的中间结果数据,并在区内进行空间复用;数据暂存区,用于存储相应层输出的只在该层的下一层使用的中间结果数据,并在区内进行空间复用。
-
公开(公告)号:CN115712506A
公开(公告)日:2023-02-24
申请号:CN202211499120.1
申请日:2022-11-28
Applicant: 中国科学院计算技术研究所
IPC: G06F9/50 , G06N3/063 , G06N3/0464 , G06N3/048 , G06N3/082
Abstract: 本发明提供了一种资源分配方法以及加速器,该加速器含有多个忆阻器阵列,该方法包括:获取待加速的卷积神经网络的结构参数以及加速器的架构参数;基于所述结构参数和架构参数确定所述卷积神经网络模型的每个卷积层的最小需求量,所述最小需求量为在该加速器上存储对应卷积层中所有权重参数所需的最小忆阻器阵列数;根据预定的约束条件,以每个卷积层在其最小需求量的基础上的分配倍数为调整对象,确定所述卷积神经网络在该加速器上运行的总处理时延最优的资源分配策略,其中,所述最优的资源分配策略指示每个卷积层最终的分配倍数;根据每个卷积层最终的分配倍数和最小需求量,确定该卷积层分配的忆阻器阵列数量。
-
公开(公告)号:CN114841329A
公开(公告)日:2022-08-02
申请号:CN202210627742.1
申请日:2022-06-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供了一种支持多序列运算的神经网络加速器及加速装置。本发明的神经网络加速器包括至少一个多序列处理装置,每个所述多序列处理装置包括运算功能模块和数据连接管理单元,所述运算功能模块包括:至少一个乘法运算模块、至少两个加法运算模块、至少一个寄存器模块、一个逻辑运算模块以及一个激活函数运算模块。本发明针对神经网络架构对非网络视觉算法任务算子的低效处理问题,提出了一种能够执行多种非神经网络算子以及支持多种向量序列操作的神经网络加速器架构。通过设计可线上配置数据操作序列的处理单元,并组合为相应的并行阵列,以实现多种视觉算法并行操作的兼容以及计算效率的提升。
-
公开(公告)号:CN114758063A
公开(公告)日:2022-07-15
申请号:CN202210272134.3
申请日:2022-03-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于八叉树结构的局部障碍物栅格地图构建方法和系统,包括根据预加载地图获取局部障碍物地图先验信息,再根据采集数据生成实际局部障碍物地图,利用两者融合提供一个准确可靠的机器人周围障碍物信息。相比于先前的地图构建方法,本发明在人流量大、环境经常改变的场景具有优势:通过地面检测将一定坡度的点云转换到xOy平面上,便于高度阈值判断和障碍物点云处理;八叉树结构可以通过点云击中和穿过概率动态更新局部三维点云,对于人员较多、环境动态变化的场景具有强适应能力;由于只保存机器人周围的局部栅格地图,减少内存占用开销,保证资源消耗不会随运行时间而线性增加;相比于激光雷达的方案,本发明具有低成本的优势。
-
-
-
-
-
-
-
-
-