一种芯片、设备以及数据处理方法

    公开(公告)号:CN117033270B

    公开(公告)日:2024-01-26

    申请号:CN202311291542.4

    申请日:2023-10-08

    Inventor: 任子木

    Abstract: 本申请公开了一种芯片、设备以及数据处理方法,属于计算机技术领域。该芯片包括跨通道处理单元、多路选择器和数据寄存器,跨通道处理单元具有获取数据寄存器中的数据组的能力;跨通道处理单元和多路选择器的输入端相连,多路选择器的输出端和数据寄存器相连;跨通道处理单元,用于获取数据寄存器保存的N个数据组,N为大于1的整数;跨通道处理单元,还用于根据对N个数据组中的至少一个数据组进行跨通道处理,得到N个运算结果;跨通道处理包括基于N个数据组中的第j个数据组得到N个运算结果中的第i个运算结果,i和j均为小于或等于N的正整数,i和j不同;多路选择器,用于将跨通道处理单元提供的N个运算结果写入数据寄存器。

    浮点数处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN117008869A

    公开(公告)日:2023-11-07

    申请号:CN202211051644.4

    申请日:2022-08-30

    Inventor: 任子木

    Abstract: 本申请涉及人工智能领域,具体涉及一种浮点数处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取第一浮点数的第一指数、第一尾数和第一尾数的第一前导零数量,获取与第一浮点数叠加的第二浮点数的第二指数和第二尾数;并行地,对第一浮点数和第二浮点数进行对阶处理获得第一移位尾数和第二移位尾数,以及,根据第一指数、第一前导零数量和第二指数确定叠加后指数;并行地,叠加第一位移尾数和第二位移尾数得到叠加后尾数,以及,预测叠加后尾数的第二前导零数量;根据叠加后尾数、叠加后指数和第二前导零数量,确定第一浮点数与第二浮点数叠加后的浮点数叠加结果。采用本方法能够提升浮点数的叠加效率。

    图像数据处理装置及方法
    23.
    发明公开

    公开(公告)号:CN116993571A

    公开(公告)日:2023-11-03

    申请号:CN202211303553.5

    申请日:2022-10-24

    Inventor: 任子木

    Abstract: 本申请提供了一种图像数据处理装置及方法,该装置包括:至少两个处理模块,所述至少两个处理模块对各自对应的像素值统计范围内的各个像素值进行并行统计;处理模块包括:数据比较单元、第一编码单元和像素值统计单元,其中:数据比较单元,用于确定待处理图像数据中的各个像素点的像素值是否处于所述处理模块对应的像素值统计范围,得到各个像素点的比较结果;第一编码单元,用于基于各个像素点的比较结果,确定各个像素点的第一编码结果,像素值统计单元,用于对各个像素点的第一编码结果进行统计处理,得到像素值统计范围内的各个像素值的统计结果。通过本申请,能够提高图像数据处理装置的面效比和处理效率。

    卷积特征处理方法、芯片、设备及介质

    公开(公告)号:CN116954553A

    公开(公告)日:2023-10-27

    申请号:CN202310326092.1

    申请日:2023-03-23

    Inventor: 任子木

    Abstract: 本申请的实施例公开了一种卷积特征处理方法、芯片、设备及介质,该方法包括:生成用于控制卷积特征进行累加处理的控制信号;将控制信号沿着列向进行打拍处理,并按照打拍时序将控制信号传输至脉动阵列的每列处理单元所对应的累加单元,获取累加单元基于每列处理单元当前时刻的卷积特征部分和,以及上一时刻的累加结果进行累加处理得到的当前时刻的累加结果,上一时刻的累加结果是每列处理单元所对应的累加单元基于控制信号获得的;存储每列处理单元当前时刻的累加结果,以根据存储的累加结果生成卷积特征向量。本申请实施例的技术方案,可以降低了卷积特征的处理功耗,且降低了卷积特征的处理成本。

    数据排序筛选装置和控制方法、装置及计算机设备

    公开(公告)号:CN116954550A

    公开(公告)日:2023-10-27

    申请号:CN202211374318.7

    申请日:2022-11-04

    Inventor: 任子木

    Abstract: 本申请公开了一种数据排序筛选装置和控制方法、装置及计算机设备,涉及AI技术领域,用于降低数据排序过程的复杂度,提升数据排序的性能,该数据排序筛选装置,通过将对输入数据进行全排序的过程与后续的双调合并过程解耦,便于对输入数据的排序过程分多级流水进行,独立出双调合并步骤,使其可单个时钟周期完成计算,可实现全流水计算,提升了数据排序处理性能,并且充分利用了硬件的并行特性,可并行处理多个输入数据,时间复杂度低,在整个排序过程中,每个数据只需要从片上缓存中加载一次,节省了功耗,消耗的硬件资源很小,并且该数据排序筛选装置实现简单,对于16输入的top16排序电路,仅需消耗128个比较器,面效比很高。

    指令处理方法、装置、程序产品、计算机设备和介质

    公开(公告)号:CN115113934B

    公开(公告)日:2022-11-11

    申请号:CN202211051073.4

    申请日:2022-08-31

    Inventor: 任子木

    Abstract: 本申请公开了一种指令处理方法、装置、程序产品、计算机设备和介质,该方法包括:对硬件循环指令的循环体进行循环执行;循环体中包含分支指令;当执行至分支指令时,获取分支指令的预测信息,预测信息用于指示预测的分支指令的下一指令;执行分支指令,并按照预测信息的指示执行预测的下一指令;获取分支指令的执行结果,执行结果用于指示确定的分支指令的下一指令;若预测的下一指令与确定的下一指令不匹配,则撤销对预测的下一指令的执行,并对循环体的当前执行参数进行校正处理;当前执行参数用于指示当前对循环体进行循环执行的进度。采用本申请,可提高对硬件循环指令的编译灵活性。

    指令执行装置、芯片、电子设备及方法

    公开(公告)号:CN120010924A

    公开(公告)日:2025-05-16

    申请号:CN202311520394.9

    申请日:2023-11-14

    Inventor: 任子木

    Abstract: 本申请公开了一种指令执行装置、芯片、电子设备及方法,属于芯片技术领域。指令执行装置包括;指令派遣单元,用于向第一流水线发送第一指令,向第二流水线发送第二指令;第一指令是存储指令和加载指令中的一种,第二指令是存储指令和加载指令中的另一种;依赖检测单元,用于在第一流水线接收到第一指令之后,从至少一个第二指令中确定至少一个目标第二指令;目标第二指令与第一指令的指令地址相同且违反指令执行时序,指令执行时序是指第一指令和目标第二指令之间的执行顺序;时序处理单元,用于控制第一指令和目标第二指令的执行过程满足指令执行时序。该指令执行装置有助于提升指令执行效率。

    指令发射方法、芯片及存储介质
    28.
    发明公开

    公开(公告)号:CN119960832A

    公开(公告)日:2025-05-09

    申请号:CN202311486113.2

    申请日:2023-11-08

    Inventor: 任子木

    Abstract: 本申请公开了一种指令发射方法、芯片及存储介质,涉及芯片技术领域。该方法包括:获取指令时序矩阵,指令时序矩阵用于记录发射队列中多个待发射指令之间的时序关系;基于指令时序矩阵确定第一指令编码,第一指令编码用于通过编码取值指示第一指令,第一指令进入发射队列的时刻早于其他指令;获取就绪指令序列,就绪指令序列用于指示待发射指令中的多个就绪指令;基于就绪指令序列和第一指令编码确定候选发射指令和第一指令的第一有效性,第一有效性用于指示第一指令的指令状态;基于候选发射指令和第一有效性从候选发射指令和第一指令中确定目标指令进行发射,提高指令发射效率。

    一种存储访问方法、处理器及电子设备

    公开(公告)号:CN119179428A

    公开(公告)日:2024-12-24

    申请号:CN202310746497.0

    申请日:2023-06-21

    Inventor: 任子木

    Abstract: 本申请提供了一种存储访问方法、处理器及电子设备;方法包括:响应于针对片上存储单元的访问请求,对所述访问请求进行读写检测,得到检测结果;当所述检测结果表征所述访问请求为目标写请求时,将所述目标写请求加入写队列中,以及,将所述写队列中所述目标写请求所指示写入的写数据,写入所述片上存储单元;当所述检测结果表征所述访问请求为目标读请求时,将所述目标读请求加入读队列中,以及,基于所述目标读请求的读地址和所述写队列中写请求的写地址,从所述片上存储单元读取所述目标读请求所指示读取的读数据;通过本申请,能够提高存储访问性能。

    一种矩阵处理方法和矩阵处理器
    30.
    发明公开

    公开(公告)号:CN119106226A

    公开(公告)日:2024-12-10

    申请号:CN202310687203.1

    申请日:2023-06-09

    Inventor: 任子木

    Abstract: 本申请实施例提供一种矩阵处理方法和矩阵处理器,可以应用于云技术、人工智能、智慧交通、车联网等各种场景;本申请可以获取神经网络模型至少两个维度的待处理特征矩阵;根据待处理特征矩阵的向量信息,确定每一维度下待处理特征矩阵的初始矩阵属性信息;对初始矩阵属性信息进行偏移处理,得到每一维度下待处理特征矩阵的偏移后矩阵属性信息;根据初始矩阵属性信息和偏移后矩阵属性信息,对待处理特征矩阵进行阵列转换处理,得到每一维度下,呈预设阵列排布的转换后特征矩阵;采用预设阵列对应的预设阵列处理装置,对每一维度下的转换后特征矩阵进行加载处理。本申请可以减少对计算资源的消耗和降低计算机设备的功耗。

Patent Agency Ranking