一种支持多核心共享访问的多类型并存访存流验证方法

    公开(公告)号:CN113535499B

    公开(公告)日:2023-10-27

    申请号:CN202110829386.7

    申请日:2021-07-22

    Abstract: 本发明公开了一种支持多核心共享访问的多类型并存访存流验证方法,该方法包括获取待测访存部件对应存储系统的系统信息,基于系统信息构建待测访存部件对应的验证系统,验证系统包括若干虚拟模型;当检测到多源核心请求指令时,确定发出多源核心请求指令的各测试激励;分别确定各测试激励对应的各虚拟模型,基于各虚拟模型并行处理多源核心请求指令,得到各虚拟响应结果。本发明短时间内实现各虚拟模型的请求发送、解析、响应处理等功能,最终通过比较真实和虚拟响应来判断待测访存部件处理、解析和转发的正确性,通过此验证方法和系统更易发现错误和错误定位,保证了待测访存部件的正确性,流片无错误。

    一种支持非线性函数扩展功能的并行查表方法及装置

    公开(公告)号:CN115328553A

    公开(公告)日:2022-11-11

    申请号:CN202211017025.3

    申请日:2022-08-24

    Abstract: 本发明公开了一种支持非线性函数扩展功能的并行查表方法及装置,涉及人工智能技术领域,包括:将非线性函数分割成若干区间,每个区间内函数值由线性函数表示,其中线性函数系数存放在查找表内,查找表位于局部存储内;进行多格式数据转换,根据函数种类指示符中的数据格式字段,针对输入源操作数的格式,进行展开并移位至预定小数点位置;获取上述数据放置规则,计算出并行查表的表内偏移地址;向量查询基地址和表内偏移地址相加,得到待访问元素的存放地址。本发明可以在普通单端口或双端口存储器上快速实现因变量到表内偏移的转化,并实现向量查表的方法,提升向量计算结构、通用寄存器等资源的利用率,从而优化流水线性能。

    一种处理器阵列局部存储混合管理技术

    公开(公告)号:CN110704362A

    公开(公告)日:2020-01-17

    申请号:CN201910864444.2

    申请日:2019-09-12

    Abstract: 本发明提供一种处理器阵列局部存储混合管理技术,属于计算机体系结构和处理器微结构技术领域。该处理器阵列局部存储混合管理技术包括如下步骤:S1:将阵列处理器中每个核心的片上局部存储(LDM)被划分为第一类区域、第二类区域和第三类区域;S2:将第一类区域设定为用以保存本地私有数据、其具体编址仅对本核心的应用程序可见的私有存储空间;S3:将第二类区域设定为用以保存多个核心的共享数据、其具体编址对多个核心的应用程序可见的共享存储空间;S4:将第三类区域设定为用以映射到整个主存空间、采用Cache的方式管理以使本核心的应用程序对可Cache空间的访问可见的Cache存储空间。本发明针对应用特征进行灵活配置,高效发挥应用的实际运行性能。

    向量查表方法以及处理器

    公开(公告)号:CN102930008A

    公开(公告)日:2013-02-13

    申请号:CN201210423150.4

    申请日:2012-10-29

    Abstract: 一种向量查表方法以及处理器。第一多次查表指令字段用于标示向量查表操作,第二、第三多次查表指令字段为源操作数寄存器的索引号,第四多次查表指令字段为目标寄存器的索引号。第二多次查表指令字段指定的寄存器内容为查询基地址,第三多次查表指令字段指定的寄存器内容包含多个待查向量元素相对于查询基地址的偏移值,第四多次查表指令字段指定存放最终查询结果的单个目标寄存器。参照第三多次查表指令字段指定的寄存器内容的拼接格式,拼接成向量查表结果,写入第四多次查表指令字段指定的目标寄存器。待查向量元素偏移值在第三多次查表指令字段指定的寄存器中的位置,规定了对应元素最终在第四多次查表指令字段指定的目标寄存器中的位置。

    用于具有多个处理器核心的处理器系统的同步器

    公开(公告)号:CN102880585A

    公开(公告)日:2013-01-16

    申请号:CN201210370444.5

    申请日:2012-09-28

    Abstract: 一种用于具有多个处理器核心的处理器系统的同步器包括:同步向量表、同步处理部件、断连分析处理部件、以及死锁检查部件。同步向量表由多个条目组成,分别用于接收并对应保存来自多个处理器核心的当前待同步位图请求信息。同步处理部件用于通过查询同步向量表来对同步向量表中的情况进行分析和处理,从而在待同步处理器核心均符合同步要求时向处理器核心返回同步完成信号。断连分析处理部件用于接收降级指示信号,并且根据降级指示信号将同步器设置为降级同步模式或者非降级同步模式;断连分析处理部件用于接收断连位信号,根据断连位信号更改同步向量表,从而实现在位处理器核心与降级断连处理器核心的同步功能。

    基于指令块的指令发射控制方法及装置、以及处理器

    公开(公告)号:CN102830952A

    公开(公告)日:2012-12-19

    申请号:CN201210326452.X

    申请日:2012-09-05

    Abstract: 本发明提供了一种基于指令块的指令发射控制方法及装置、以及处理器。判断处于指令准备发射状态的指令的指令类型。若判定所述处于指令准备发射状态的指令的指令类型是栏栅指令,则进一步判断发射条件;若判定还有更先执行序的指令不能发射,则使得作为栏栅指令的所述处于指令准备发射状态的指令不能发射;若判定更先执行序的指令均能发射或均已发射,则发射作为栏栅指令的所述处于指令准备发射状态的指令。如果判定所述处于指令准备发射状态的指令的指令类型是普通指令,则进一步判断发射条件;若判定还有更先执行序的栏栅指令未发射,则使得作为普通指令的所述处于指令准备发射状态的指令不能发射;若判定无更先执行序的栏栅指令未发射,则发射作为普通指令的所述处于指令准备发射状态的指令。

    多核处理器及多核处理器组

    公开(公告)号:CN102446158A

    公开(公告)日:2012-05-09

    申请号:CN201010508842.X

    申请日:2010-10-12

    Abstract: 一种多核处理器及多核处理器组,包括至少一个主核、至少一个从核阵列、第一互连结构和从核互连结构,所述从核阵列包括多个从核,所述从核与主核异构,其中,所述第一互连结构和从核互连结构用于所述主核与所述从核阵列间的通信,所述从核互连结构还用于所述从核阵列中任意两从核间的通信,作为一个优选的技术方案,所述主核为通用处理器核,所述从核为微结构和指令集经过精简优化的处理器核,且所述多核处理器集成在同一芯片上。本发明改善了处理器核之间的通信效率,提高了整个多核处理器的计算密度,实现了通用控制功能和高计算密度的均衡。

    基于阵列结构的处理器核心的通信方法及通信装置

    公开(公告)号:CN102446157A

    公开(公告)日:2012-05-09

    申请号:CN201010508839.8

    申请日:2010-10-12

    Abstract: 一种基于阵列结构的处理器核心的通信方法及通信装置。所述基于阵列结构的处理器核心的通信方法包括:发送端处理器核心获取数据发送指令并进行解析;基于所述数据发送指令的解析结果,所述发送端处理器核心从其通用寄存器文件中获取数据,并将所述数据存储到其发送缓冲单元中;发送端处理器核心将其发送缓冲单元中的数据发送至所述数据发送指令指示的目标处理器核心的接收缓冲单元;目标处理器核心获取数据接收指令并进行解析;基于所述数据接收指令的解析结果,所述目标处理器核心从其接收缓冲单元中获取数据,并将数据存储到其通用寄存器文件中。

    一种无横向一致性的众核精简Cache协议实现方法

    公开(公告)号:CN114217809B

    公开(公告)日:2024-04-30

    申请号:CN202110398338.7

    申请日:2021-04-14

    Abstract: 本发明公开一种无横向一致性的众核精简Cache协议实现方法,包括以下步骤:S1、对Cache行内数据更新情况进行分析,标记出被更新的数据;S2、如果Cache行内所有数据都没有被更新,或者Cache行内所有数据都被更新,跳转至S5,如果Cache行内只有部分数据被更新,跳转至S3;S3、当一个Cache行内的数据只有部分内容需要写回时,其他位掩码置0;S4、根据掩码粒度大小与置位情况,更新主存中对应掩码位为1的数据;S5、直接对Cache行进行写回操作。本发明有效解决共享主存Cache结构的假共享问题,还可以提高写回效率、有效降低处理器在Cache数据管理方面的硬件开销。

Patent Agency Ranking