数据处理装置、方法及车辆
    1.
    发明公开

    公开(公告)号:CN119415562A

    公开(公告)日:2025-02-11

    申请号:CN202411486830.X

    申请日:2024-10-23

    Abstract: 本申请实施例提供一种数据处理装置、方法及车辆。该装置为采用存储器对数据进行运算和存储的存算一体装置,用于依次对多个待处理数据的特征图进行计算以得到各自对应的查询特征;该装置包括:预计算模块,用于对当前待处理数据的特征图进行权重变换,得到并缓存预计算结果;采样模块,用于对目标查询特征进行采样,得到采样结果,目标查询特征包括查询生成模块计算得到的、当前待处理数据之前的任一待处理数据对应的查询特征;注意力权重模块,用于对目标查询特征进行注意力权重计算,得到注意力结果;查询生成模块,用于根据注意力结果、采样结果和预计算结果进行计算,得到并缓存待处理数据对应的查询特征。该装置能提高数据处理的效率。

    模型量化方法、装置、电子设备及存储介质

    公开(公告)号:CN117574966A

    公开(公告)日:2024-02-20

    申请号:CN202311552181.4

    申请日:2023-11-21

    Abstract: 本申请公开一种模型量化方法,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。本申请还提供一种模型量化装置、电子设备及存储介质,可以灵活选择权重的位宽,在保证压缩效率的同时减少精度损失。

    可重构架构、加速器、电路部署和计算数据流方法

    公开(公告)号:CN112181895B

    公开(公告)日:2023-06-06

    申请号:CN202010910280.5

    申请日:2020-09-02

    Inventor: 蒋力 赵怿龙

    Abstract: 本发明公开了一种基于NVM阵列的可重构架构、加速器、电路部署和计算数据流方法,架构CU内包含RU电路、V‑Adder电路、NNADC+Act电路、输入输出寄存器几个电路模块,RU电路可以根据需要配置成VMM、DAC和S+A功能模块,V‑Adder电路用于将两个VMM的输出模拟信号相加,NNADC+Act电路主要用于模拟信号向数字信号的转换,在第二级NVM交叉阵列加开关,使得在断开开关时形成一个孤立的NVM交叉阵列,变为S+A的电路,同时计算激活函数的功能。架构增加芯片部署的灵活性,并设计了CU内的互连机制以支撑可重构配置;解决了DAC与VMM比例不均衡、用NVM交叉阵列设计了更多的模块解决了电路比例不均衡的问题。同时,可重构设计,则相较于非重构设计减少了S+A的闲置,节省了资源,提高了能效和计算密度。

    一种基于Crossbar架构的剪枝方法及系统

    公开(公告)号:CN111507473B

    公开(公告)日:2023-05-12

    申请号:CN202010310388.0

    申请日:2020-04-20

    Inventor: 蒋力 褚超群

    Abstract: 本发明涉及一种基于Crossbar架构的剪枝方法及系统,该方法包括:对神经网络当前层待处理的权值矩阵进行不考虑架构因素的结构化剪枝,得到第一权值矩阵;权值矩阵为神经网络的权值矩阵;根据第一权值矩阵的尺寸与crossbar的尺寸,确定剪枝方案;剪枝方案包括:基于区块的结构化剪枝、交叉阵列行剪枝和交叉阵列列剪枝;根据剪枝方案对第一权值矩阵进行剪枝,得到第二权值矩阵;第二权值矩阵用于映射至加速器中的crossbar阵列,通过加速器对神经网络进行加速。本发明可以降低Crossbar的资源占用,降低硬件资源的的浪费。

    一种基于移动设备的在线稀疏训练方法及系统

    公开(公告)号:CN111738435A

    公开(公告)日:2020-10-02

    申请号:CN202010574063.3

    申请日:2020-06-22

    Abstract: 本发明涉及一种基于移动设备的在线稀疏训练方法及系统。该方法包括:在云端对神经网络模型进行结构化剪枝,得到稀疏神经网络模型;对所述稀疏神经网络模型进行编码,得到编码后的神经网络模型;所述编码后的神经网络模型包括数据部分和控制部分,所述数据部分为所述稀疏神经网络模型中非零滤波器,所述控制部分用于记录所述稀疏神经网络模型的稀疏数据;在端侧移动设备上对所述编码后的神经网络模型进行稀疏训练。本发明可以提高移动设备数据处理的精度,提高移动设备端的性能。

    一种基于Crossbar架构的剪枝方法及系统

    公开(公告)号:CN111507473A

    公开(公告)日:2020-08-07

    申请号:CN202010310388.0

    申请日:2020-04-20

    Inventor: 蒋力 褚超群

    Abstract: 本发明涉及一种基于Crossbar架构的剪枝方法及系统,该方法包括:对神经网络当前层待处理的权值矩阵进行不考虑架构因素的结构化剪枝,得到第一权值矩阵;权值矩阵为神经网络的权值矩阵;根据第一权值矩阵的尺寸与crossbar的尺寸,确定剪枝方案;剪枝方案包括:基于区块的结构化剪枝、交叉阵列行剪枝和交叉阵列列剪枝;根据剪枝方案对第一权值矩阵进行剪枝,得到第二权值矩阵;第二权值矩阵用于映射至加速器中的crossbar阵列,通过加速器对神经网络进行加速。本发明可以降低Crossbar的资源占用,降低硬件资源的的浪费。

    带有故障修复装置的三维芯片及故障修复和数据读取方法

    公开(公告)号:CN107068195A

    公开(公告)日:2017-08-18

    申请号:CN201710304692.2

    申请日:2017-05-03

    Inventor: 韩焱 李天健 蒋力

    Abstract: 本发明提供一种带有故障修复装置的三维芯片及故障修复和数据读取方法,其中,所述故障修复方法包括:1)通过测试得到每层晶片中错误单元的地址信息;2)将所述三维芯片划分为映射层和被映射层,利用错误聚集算法将映射层中的错误单元聚集到被映射层;3)通过全局冗余资源对被映射层中的错误单元进行冗余修复。通过本发明所述带有故障修复装置的三维芯片及故障修复和数据读取方法,解决了现有修复方法中需安排较多的冗余资源,造成冗余资源浪费,增加了芯片的生产成本的问题。

    模型量化方法、装置、电子设备及存储介质

    公开(公告)号:CN117574966B

    公开(公告)日:2024-10-25

    申请号:CN202311552181.4

    申请日:2023-11-21

    Abstract: 本申请公开一种模型量化方法,包括:获取当前网络层的权重矩阵,对权重矩阵进行划块得到多个权重块;对多个权重块内的权重绝对值按列排序重组得到多个目标权重块;根据每个目标权重块的量化偏差和量化阈值确定每个目标权重块的量化精度;根据多个目标权重块在量化前后的权重分布偏差和分布阈值对量化阈值进行调节以获取多个目标权重块的目标量化精度;根据多个目标权重块的目标量化精度对多个目标权重块进行量化得到多个量化权重块;采用按位交错的映射方式将多个量化权重块映射到多个交叉阵列单元上。本申请还提供一种模型量化装置、电子设备及存储介质,可以灵活选择权重的位宽,在保证压缩效率的同时减少精度损失。

    计算图处理方法、装置、电子设备及存储介质

    公开(公告)号:CN117764122B

    公开(公告)日:2024-06-25

    申请号:CN202311861591.7

    申请日:2023-12-29

    Abstract: 本申请公开一种计算图处理方法、装置、电子设备及存储介质,计算图处理方法包括:解析机器学习模型以得到第一计算图,第一计算图包括多个计算节点;对第一计算图进行图级优化操作以得到第二计算图;图级优化操作包括地址传递流优化操作,地址传递流优化操作包括:根据第一计算图中多个计算节点的节点信息和数据依赖关系获取第一计算图的张量数据流;对张量数据流中的张量数据进行稀疏化处理得到相应的稀疏张量数据,稀疏张量数据采用张量感知的稀疏存储格式进行存储;根据张量数据流将稀疏张量数据的地址索引串联成地址传递流;根据地址传递流对第一计算图进行优化。本申请可以实现自动高效的稀疏计算,提高计算效率。

    硬件辅助页表管理系统、方法、介质、程序产品及终端

    公开(公告)号:CN119621608A

    公开(公告)日:2025-03-14

    申请号:CN202411840655.X

    申请日:2024-12-13

    Abstract: 本申请提供硬件辅助页表管理系统、方法、介质、程序产品及终端,通过内存管理单元和内存单元的协同工作实现高效的地址转换。包括转换后备缓冲区命中检测、来宾页表查找、页遍历缓存查找等关键步骤。内存管理单元接收访问指令后,通过转换后备缓冲区命中检测模块执行检测;若未命中,则由来宾页表查找模块获取对应的宿主物理地址。系统在页遍历缓存模块中执行查找,必要时访问内存单元的二级缓存,并将查找结果存储至预设格式的缓存行中。本申请通过硬件辅助方式实现缓存中客户页表地址的透明转换,并提供了完整的影子页表项生命周期管理方案。

Patent Agency Ranking