-
公开(公告)号:CN116414345A
公开(公告)日:2023-07-11
申请号:CN202111634856.0
申请日:2021-12-29
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请涉及一种多输入浮点数处理方法、装置、计算机设备和存储介质。所述方法包括:获取与目标任务对应的多个待处理的浮点数,并分别提取每个浮点数中指数部分的指数值和尾数部分的尾数值;依据各浮点数的指数值大小对多个所述浮点数进行排序,基于排序结果从多个具有不同预设位数的移位器中为每个浮点数分别分配对应的移位器;对于每个浮点数,均通过与所述浮点数对应分配的移位器,对相应浮点数的尾数值进行移位处理,得到移位结果;基于各所述移位结果确定与所述目标任务对应的浮点数处理结果。采用本方法能够显著减少硬件资源的开销。
-
公开(公告)号:CN114416180B
公开(公告)日:2022-07-15
申请号:CN202210312611.4
申请日:2022-03-28
Applicant: 腾讯科技(深圳)有限公司
Abstract: 本申请公开了一种向量数据的压缩方法、向量数据的解压方法、装置及设备,涉及数据处理技术领域。所述方法包括:源向量寄存器存储源向量数据,该源向量数据被划分为n个源子向量,n个源子向量和n组多路选择器一一对应;n组多路选择器中的第i组多路选择器对源向量数据中的第i个源子向量中的有效元素进行选择性排列,得到第i个目标子向量;数据合并装置对n个源子向量对应的n个目标子向量进行移位合并,得到目标向量数据;其中,目标向量数据中的有效元素位于目标向量数据的头部;目标向量寄存器对目标向量数据中的有效元素进行存储。本申请通过对向量数据进行分段压缩,再进行合并,可有效减少布线的拥塞程度,从而大幅度减小处理器的面积。
-
公开(公告)号:CN120010925A
公开(公告)日:2025-05-16
申请号:CN202311522894.6
申请日:2023-11-15
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
IPC: G06F9/38
Abstract: 本申请公开了一种访存违例预测装置、方法、芯片及计算机设备,属于计算机技术领域。包括:第一寄存器组、第二寄存器组、读写控制器、第一多路选择器以及访问指令发射队列;第一寄存器组,用于存储访存违例表;第二寄存器组,用于存储待发射计数表;读写控制器,用于基于访问指令的第一访问指令存储地址,查询第一寄存器组中的访存违例表,并控制第一寄存器组将第一计数索引传输至第一多路选择器的选择输入端;第一多路选择器,用于基于接收到的第一计数索引,从待发射计数表中选择访问指令对应的第一待发射计数值;访问指令发射队列,用于在接收到访问指令的情况下,保存访问指令,以及基于访问指令对应的第一待发射计数值,控制发射访问指令。
-
公开(公告)号:CN119987869A
公开(公告)日:2025-05-13
申请号:CN202311501892.9
申请日:2023-11-10
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
IPC: G06F9/4401 , G06F9/445
Abstract: 本申请公开了一种应用于处理器的指令唤醒模组、处理器、设备和方法,涉及芯片技术领域。所述第一保留单元用于根据第一存储单元中的第一加载指令,得到第一指示信息,第一指示信息用于指示第一加载指令的目标寄存器;第二保留单元用于在第一加载指令从第一保留单元到达地址生成单元的过程中,根据第一指示信息,确定第二存储单元中与第一指示信息相匹配的至少一条关联指令;第一加载单元用于对第一加载指令进行加载;第二加载单元用于在第一加载指令加载成功的情况下,对至少一条关联指令进行执行。本申请提出的指令唤醒方案提前了两个时钟周期,缩短了关联指令在第二保留单元中停留的时间,提升了处理器的指令唤醒模组的性能。
-
公开(公告)号:CN119201368A
公开(公告)日:2024-12-27
申请号:CN202310757922.6
申请日:2023-06-25
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
Abstract: 本申请实施例公开了一种信息处理的方法、装置、设备、存储介质及程序产品,至少涉及人工智能领域。不仅减少访问存储器次数和系统功耗,而且增加数据处理的并行度。该方法包括:获取包括核向量信息与多个时序相邻的特征图向量信息的第一待处理信息;拼接多个特征图向量信息,得到目标特征图向量信息;在每个时钟周期中,基于每个核元素与目标特征图向量信息中目标位置上的特征元素确定对应时钟周期的信息处理结果,目标位置包括与核元素相同的元素位置以及与核元素的元素位置相差K个滑动步长的位置,每两个相邻的时钟周期之间的第一滑动窗口与第二滑动窗口均相差N个滑动步长;基于至少两个时钟周期的信息处理结果确定目标处理结果。
-
公开(公告)号:CN119129485A
公开(公告)日:2024-12-13
申请号:CN202410708474.5
申请日:2024-05-31
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
Abstract: 本申请公开了一种芯片、设备以及数据处理方法,属于半导体技术领域。该芯片包括:依次级联的拓展单元、排序单元和截断单元;所述拓展单元,用于在m个输入数据中每个输入数据的末位,添加预定比特长度的序号拓展位,得到m个加长后的数据;所述m个输入数据中在前输入数据的序号拓展位不大于在后输入数据的序号拓展位,m是大于1的整数;所述排序单元,用于对所述m个加长后的数据按照数值大小升序或降序排列,得到m个输出数据;所述截断单元,用于在所述m个输出数据中的每个输出数据的末位删除所述预定比特长度的序号拓展位,得到修正后的m个输出数据。
-
公开(公告)号:CN119105729A
公开(公告)日:2024-12-10
申请号:CN202310686866.1
申请日:2023-06-09
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
IPC: G06F7/544
Abstract: 本申请公开了一种处理器的控制方法、处理器及电子设备,该方法包括:将第一数据的第一尾数输入处理器中的第一部分积生成单元,将第二数据的第二尾数输入第二部分积生成单元;通过第一部分积生成单元生成第一尾数与第一尾数的部分积,得到第一组部分积,通过第二部分积生成单元生成第二尾数与第二尾数的部分积,得到第二组部分积;通过第一CSA对第一组部分积进行相加处理,得到第一进位值和第一求和值,通过第二CSA对第二组部分积进行相加处理,得到第二进位值和第二求和值;对第一指数、第二指数、第一进位值和第一求和值、第二进位值和第二求和值进行处理,得到目标处理结果。本申请解决了相关技术中处理器的处理效率较低的技术问题。
-
公开(公告)号:CN119091937A
公开(公告)日:2024-12-06
申请号:CN202310665871.4
申请日:2023-06-06
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
Abstract: 本申请公开了一种数据处理方法和系统及芯片。其中,该方法包括:接收第一主设备发送的第一数据处理请求,第一数据处理请求包括用于指定数据处理系统中的至少一个逻辑存储块的第一地址信息,数据处理系统包括被设置为由多个逻辑存储块预先进行走线汇聚的多个存储块分组,响应于第一存储块分组检测第一数据处理请求有效,从第一物理存储块和第二物理存储块分别获取第一数据和第二数据,对第一数据和第二数据进行交织处理,生成第一目标数据。本申请可以应用于包括但不限于基于人工智能的数据存储领域,本申请解决了相关技术中数据处理的效率较低,片上存储系统布线复杂度较高的技术问题。
-
公开(公告)号:CN118916596A
公开(公告)日:2024-11-08
申请号:CN202310516046.8
申请日:2023-05-08
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
Abstract: 本申请实施例公开了一种矩阵数据转置方法、矩阵数据转置装置及芯片,该矩阵数据转置方法通过对初始矩阵数据进行第一循环移位得到移位矩阵数据,将每至少两个相邻的矩阵元素作为元素集,进而将元素集写入缓存单元,能够有效地降低人工智能芯片内缓存单元的例化数量,从而降低人工智能芯片的面积,从各个所述缓存单元读取目标元素集,并组合得到目标行数据,然后通过简单的矩阵元素重组,进而得到转置后的所述初始矩阵数据,从而能够有效降低时间复杂度,提升转置性能,有效提高面效比,实现了在降低人工智能芯片的面积的同时有效地提升转置性能,可以广泛应用于人工智能、云技术等技术领域。
-
公开(公告)号:CN118860946A
公开(公告)日:2024-10-29
申请号:CN202310481576.3
申请日:2023-04-27
Applicant: 腾讯科技(深圳)有限公司
Inventor: 任子木
IPC: G06F15/163 , G06F15/80 , G06F9/54
Abstract: 本申请实施例提供了一种数据处理方法、装置、设备和存储介质,可以实现矢量处理与标量处理解耦,从而降低AI处理器整体的设计和验证的复杂度。有鉴于此,本申请一方面提供一种数据处理方法,包括:在指令包中的标量指令执行完成之后,根据指令包中的多个矢量指令生成矢量指令队列;对矢量指令队列中的第一指令进行指令译码得到第一指令的控制信号集合和指令编码;将控制信号集合广播至矢量处理单元,并根据指令编码对第一指令进行检测得到检测结果;在检测结果指示允许第一指令发射时,发射第一指令至矢量处理单元;利用矢量处理单元根据控制信号集合执行第一指令。本申请提供的技术方案可应用于计算机、云技术、人工智能等领域。
-
-
-
-
-
-
-
-
-