支持进位借位正常传递的多精度大整数算术运算加速单元

    公开(公告)号:CN110716709B

    公开(公告)日:2021-10-29

    申请号:CN201910864339.9

    申请日:2019-09-12

    Abstract: 本发明提供支持进位借位正常传递的多精度大整数算术运算加速单元,属于计算机体系结构和处理器微结构技术领域。该支持进位借位正常传递的多精度大整数算术运算加速单元包括512位操作数A[511:0]、512位操作数B[511:0]、进位借位寄存器索引idx、进位借位寄存器、512位运算结果RSLT[511:0]、功能码opf和运算装置。本发明可以直接实现512位数据之间的加减运算,进位借位寄存器保存512位计算的进借位,便于扩展实现更高精度大整数之间的加减运算,还可以直接实现两组128位数据之间的乘法运算,配合移位加操作可扩展实现更高精度大整数之间的乘法运算。

    一种可同时支持多套Cache数据私有段动态设置的方法

    公开(公告)号:CN110688329B

    公开(公告)日:2021-08-10

    申请号:CN201910839658.4

    申请日:2019-09-06

    Abstract: 本发明公开了一种可同时支持多套Cache数据私有段动态设置的方法,包括步骤S1、确定目标数据Cache中需要设置的n套私有段数据位置地址,为各个私有段数据设置相对应的n套第一私有段寄存器;S2、在目标数据Cache中分别设置与每套私有段数据相对应的第一比较器、第二比较器;S3、按一定规则对需要写入Cache中的数据行进行判断,来确定其是否具有“私有段标准”;S4、确认符合“私有段标准”后,在指令Cache中生成私有段设置指令;S5、设置指令发射规则判断器,对指令Cache内的指令执行情况进行判断;S6、确认在指令Cache内排列在私有段设置指令前的指令全部执行结束后,开始执行私有段设置指令,将需要写入Cache中的数据行写入与对应的私有段位置地址相联的数据Cache中。

    基于窗口的错误访存请求重传系统及方法

    公开(公告)号:CN110727530B

    公开(公告)日:2021-02-19

    申请号:CN201910861819.X

    申请日:2019-09-12

    Abstract: 本发明涉及计算机体系结构与处理器微结构技术领域,具体为一种基于窗口的错误访存请求重传系统及方法。基于窗口的错误访存请求重传系统,包括重传缓冲,用于缓存正在飞行的请求,如果请求完成则将其释放,如果请求出错则根据出错请求的错误类型进行重传;错误监测模块,用于获取出错请求的错误类型。基于窗口的错误访存请求重传方法,包括1)将符合要求的请求进行发射并加入到读FIFO或写FIFO中;2)如果请求出错,则根据出错请求的错误类型通过重传发射FIFO进行重传;如果请求发射正常,则将其释放。本申请能够有效挽救大部分由于DDR4存储器访存链路上信号偶发错误导致的读ECC错、写CRC错和命令地址校验错所带来的故障,使其能够满足访存请求的保序原则。

    一种支持写暗示的硬件高速缓存数据装入方法

    公开(公告)号:CN110716887A

    公开(公告)日:2020-01-21

    申请号:CN201910857256.7

    申请日:2019-09-11

    Abstract: 本发明包括下述步骤:S1、确定需要目标主存的主存数据行的地址信息,该地址信息由写暗示指令携带;S2、通过CPU向目标Cache发出写暗示指令,所述写暗示指令生成写暗示标记,并且将要携带的目标主存的主存数据行地址映射为目标Cache中的缓存行;S3、判断映射的目标Cache中对应的缓存行是否访问命中;S4、确定映射的目标Cache中对应的缓存行命中,则判断缓存行是否有效;S5、确定缓存行有效时,则将该缓存行淘汰回主存;S6、设置缓存行有效,并结束处理,后续对写暗示装入的缓存行进行访问时,按照正常的高速缓存访问方式进行。本发明通过在硬件高速缓存中直接占用缓存行,而不读取并装入对应的主存行,显著降低缓存行第一次访问主存的延迟。

    一种可同时支持多套Cache数据私有段动态设置的方法

    公开(公告)号:CN110688329A

    公开(公告)日:2020-01-14

    申请号:CN201910839658.4

    申请日:2019-09-06

    Abstract: 本发明公开了一种可同时支持多套Cache数据私有段动态设置的方法,包括步骤S1、确定目标数据Cache中需要设置的n套私有段数据位置地址,为各个私有段数据设置相对应的n套第一私有段寄存器;S2、在目标数据Cache中分别设置与每套私有段数据相对应的第一比较器、第二比较器;S3、按一定规则对需要写入Cache中的数据行进行判断,来确定其是否具有“私有段标准”;S4、确认符合“私有段标准”后,在指令Cache中生成私有段设置指令;S5、设置指令发射规则判断器,对指令Cache内的指令执行情况进行判断;S6、确认在指令Cache内排列在私有段设置指令前的指令全部执行结束后,开始执行私有段设置指令,将需要写入Cache中的数据行写入与对应的私有段位置地址相联的数据Cache中。

    向量查表方法
    16.
    发明授权

    公开(公告)号:CN102930008B

    公开(公告)日:2015-10-07

    申请号:CN201210423150.4

    申请日:2012-10-29

    Abstract: 一种向量查表方法。第一多次查表指令字段用于标示向量查表操作,第二、第三多次查表指令字段为源操作数寄存器的索引号,第四多次查表指令字段为目标寄存器的索引号。第二多次查表指令字段指定的寄存器内容为查询基地址,第三多次查表指令字段指定的寄存器内容包含多个待查向量元素相对于查询基地址的偏移值,第四多次查表指令字段指定存放最终查询结果的单个目标寄存器。参照第三多次查表指令字段指定的寄存器内容的拼接格式,拼接成向量查表结果,写入第四多次查表指令字段指定的目标寄存器。待查向量元素偏移值在第三多次查表指令字段指定的寄存器中的位置,规定了对应元素最终在第四多次查表指令字段指定的目标寄存器中的位置。

    基于序号的多队列保序方法

    公开(公告)号:CN102945220B

    公开(公告)日:2015-08-12

    申请号:CN201210396345.4

    申请日:2012-10-17

    Abstract: 本发明提供了一种基于序号的多队列保序方法。在队列一的出口和入口分别设立出口计数器和入口计数器;入口计数器每收到一个包加一,出口计数器每发送一个包加一;进入队列二的消息包携带有进入队列二时的队列一的入口计数器的计数值作为序号;进入队列二的消息包在准备出队时,将携带的序号与队列一的入口计数器当前值和出口计数器当前值进行比较,以判断是否可以出队。当根据准备出队的消息包携带的序号、以及队列一的入口计数器当前值和出口计数器当前值判定在所述准备出队的消息包之前的进入队列一的消息包已全部发出时,使所述准备出队的消息包出队。

    基于轻量级消息和共享局部存储器的协同计算系统及方法

    公开(公告)号:CN115328657A

    公开(公告)日:2022-11-11

    申请号:CN202211023541.7

    申请日:2022-08-25

    Abstract: 本发明属于高性能微处理器领域,涉及基于轻量级消息和共享局部存储器的协同计算系统及方法。包括:S1主核心执行核心算法;S2判断是否执行到加速计算部分,若否则返回步骤S1,若是则执行步骤S3;S3主核心继续执行程序中的核心算法,并同时发送轻量级消息至数据中转处理器;S4数据中转处理器在局部数据存储器中提取相应位置处的原始数据并转发至异构核心;S5异构核心进行相应计算以得到相应的结果数据,并将结果数据返回至数据中转处理器;S6数据中转处理器将结果数据发送至局部数据存储器,局部数据存储器将结果数据存储至相应位置处,以供主核心提取。本发明提供基于轻量级消息和共享局部存储器的协同计算系统及方法,系统结构简洁、交互性能高。

    一种支持阵列私有和共享数据访问的地址标识方法及装置

    公开(公告)号:CN115328619A

    公开(公告)日:2022-11-11

    申请号:CN202211038503.9

    申请日:2022-08-29

    Abstract: 本申请公开了一种支持阵列私有和共享数据访问的地址标识方法及装置,其方法包括:当检测到芯片阵列内任意一个源计算核心执行访存指令时,计算出访问地址;基于访问地址判断访存指令的访问类型;当确定访问类型为共享空间访问时,基于源计算核心的请求转发部件将访存指令的请求转发至芯片阵列的局域网络;基于局域网络将访存指令的请求发送至目标计算核心,并由目标计算核心的访存部件对本地存储数据进行访问;对访存指令、访存指令的访问类型以及目标计算核心进行标识。本方法可支持阵列内私有和共享数据访问两种方式,通过在阵列内进行解析处理和路由访问,使得芯片具有轻量级和处理简单的特征,且还可有效改善计算性能以及数据访问速率。

    一种基于FPGA内部IDDR和ODDR电路的管脚复用装置及方法

    公开(公告)号:CN110704366A

    公开(公告)日:2020-01-17

    申请号:CN201910858177.8

    申请日:2019-09-11

    Abstract: 本发明涉及大规模FPGA验证平台实现技术领域,具体为一种基于FPGA内部IDDR和ODDR电路的管脚复用装置及方法。一种基于FPGA内部IDDR和ODDR电路的管脚复用装置,包括输入输出单元,以IDDR电路作为输入、ODDR电路作为输出。一种基于FPGA内部IDDR和ODDR电路的管脚复用方法,包括1)采用FPGA内部的IDDR电路和ODDR电路为基本输入输出单元。本申请采用FPGA内部的IDDR电路和ODDR电路为基本输入输出单元,实现多FPGA片间的信号传输,有效控制了输入输出的延迟一致性;FPGA片间仅传输数据信号,不传输倍频发送时钟,其数据通过本地时钟产生的倍频接收时钟进行采样接收,该电路通过动态配置接口来调节接收时钟的相位,从而实现不同传输延迟下的可靠传输。

Patent Agency Ranking