一种两级运算架构的异构多核处理器

    公开(公告)号:CN102609245B

    公开(公告)日:2014-09-17

    申请号:CN201110435859.1

    申请日:2011-12-22

    Abstract: 本发明公开了一种异构多核处理器,包括宽数据流运算模块、控制/调用模块和数据交互模块,其中所述宽数据流运算模块运行代数指令,用于完成大块、大面、大线等宽数据流的密集型运算;所述控制/调用模块运行标量指令,用于完成对宽数据流运算部分的顶层参数设置,控制它的运算,同时也完成宽数据流计算部分的非连续二次计算任务;所述数据交互模块用于完成整个异构多核处理器的互连与数据交互。本发明的异构多核处理器基于两级运算架构器,它分离了宽数据流式运算和控制/调用类运算,大大增强了数据流水的完整性,并且保证了高密度计算的连续性和封闭性,降低了运算结点间的通讯消耗,进而大大提高各个运算部件的使用效率。

    多维DMA传输装置与方法

    公开(公告)号:CN102567258B

    公开(公告)日:2014-08-27

    申请号:CN201110449966.X

    申请日:2011-12-29

    Abstract: 本发明公开了一种多维DMA传输装置与方法,所述装置包括读Buffer(400)、数据FIFO(401)、写Buffer(402)、读控制器(403)和写控制器(404)。所述读Buffer(400)用于暂存在读操作过程中新读入的数据;所述数据FIFO(401)用于存储暂时积压下来的数据;所述写Buffer(402)用于暂存在写操作过程中将要写出的数据;所述读控制器(403)用于控制读操作过程,发送读请求并对该请求的回复进行处理;所述写控制器(404)用于控制写操作过程,发送写请求并对该请求的回复进行处理。本发明适合于矩阵分割、矩阵重组、矩阵扩展等多种DSP基本操作,将简单的处理过程与复杂处理过程相分离后并行执行,减少了核处理时间。

    一种用于并行FFT计算的数据存取方法及装置

    公开(公告)号:CN102411491B

    公开(公告)日:2014-01-29

    申请号:CN201110460582.8

    申请日:2011-12-31

    Abstract: 本发明提供一种用于并行FFT计算的数据存取方法及装置。该方法将FFT计算数据和旋转因子存放在多粒度并行存储器中,并用统一的蝶形表达式对整个计算过程中的FFT数据和对应的旋转因子进行分组,每分组数据包含多个蝶形,可并行计算;同时根据该蝶形表达式,可方便生成各个分组的数据地址和旋转因子系数地址,利用不同的读写粒度,可从多粒度存储器中并行读写数据和对应的旋转因子。本发明还提供一种用于并行FFT计算的数据存取装置。利用本发明,数据的读写过程中不会产生存储器冲突,也不需要额外的步骤再对读写数据进行排序,同时,本发明可根据具体实现灵活指定并行粒度。

    具有可重构低功耗数据交织网络的数字信号处理器

    公开(公告)号:CN101847093B

    公开(公告)日:2013-09-04

    申请号:CN201010162202.8

    申请日:2010-04-28

    Abstract: 本发明公开了一种具有可重构低功耗数据交织网络的数字信号处理器,包括一个N路并行向量运算单元、一个N路并行向量寄存器堆、一个N路并行向量存储器和一个N路可重构并行数据交织网络,其中,N路可重构并行数据交织网络用于连接N路并行向量运算单元、N路并行向量寄存器堆和N路并行向量存储器,并管理其中的数据传输。利用本发明,通过该N路可重构并行数据交织网络,数据可以连续不间断的并行传输并在需要时直接从N路并行向量运算单元运算结果旁路至操作数输入,而不经过N路并行向量寄存器堆和/或N路并行向量存储器,克服了传统数据传输管理技术局限性,提高了数据传送的效率,降低了功耗,满足了不同宽度数据交织的需求。

    使用低速多端口功能单元代替高速功能单元的系统及方法

    公开(公告)号:CN103257668A

    公开(公告)日:2013-08-21

    申请号:CN201310139440.0

    申请日:2013-04-19

    Abstract: 本发明公开了一种低速多端口功能单元代替高速功能单元的系统,该系统包括多端口低速功能单元和回复拼接选通单元,其中,多端口低速功能单元的每一个端口接收一组高速时钟请求信号和一个低速时钟,高速时钟主频是低速时钟主频的N倍,N是大于等于1的整数,相邻两个低速时钟之间仅偏移一个高速时钟周期,多端口低速功能单元将处理后的多端口输出信号经由回复拼接选通单元合成一组高速信号返回高速时钟域。该方案通过多端口分时复用的方法,简便地替代了高速功能单元模块,为某些高速功能单元模块的设计提供了一种较为简单的方法。

    一种任意倍数时钟域同步装置及方法

    公开(公告)号:CN103236839A

    公开(公告)日:2013-08-07

    申请号:CN201310139437.9

    申请日:2013-04-19

    Inventor: 刘子君 王东琳

    Abstract: 本发明公开了一种任意倍数时钟域同步装置,该装置包括随低速时钟进行不断翻转的寄存器、高速时钟驱动的多级锁存寄存器和标志信号产生单元,其中,随低速时钟进行不断翻转的寄存器不断产生伴随时钟沿不断翻转的信号,将该信号在多级高速锁存寄存器进行锁存而产生锁存信号,标志信号产生单元根据锁存信号产生沿翻转标志信号。本发明可以有效的确定任意倍数同步时钟之间的相位关系,其中只需要综合工具按正常的综合方法进行处理即可,不需要设计复杂的约束条件,简单高效。

    一种分布式片上调试系统

    公开(公告)号:CN103226504A

    公开(公告)日:2013-07-31

    申请号:CN201310139457.6

    申请日:2013-04-19

    Abstract: 本发明公开了一种可针对单核、同构多核或异构多核进行调试的装置,包括调试系统接口,集中调试模块,交换网络,全局调试模块和若干个分布式调试模块。该装置对目标核调试时,调试系统接口接收调试数据包并发送到集中调试模块进行命令解析,调试命令经过交换网络被发送到每个处理核所对应的分布式调试模块,各调试模块的调试结果信息经过集中调试模块被上传至调试系统接口。全局调试模块可以下行调试命令至各分布式调试模块并监控各分布式调试模块的调试事件状态。

    一种应用于并行滤波运算的数据缓存装置

    公开(公告)号:CN103218314A

    公开(公告)日:2013-07-24

    申请号:CN201310139573.8

    申请日:2013-04-19

    Abstract: 本发明公开了一种用于并行滤波运算的数据缓存装置,包括缓冲区实体,该缓冲区实体用于缓冲来自一个多粒度存储器的数据,还包括读缓冲逻辑、初始化缓冲逻辑和更新缓冲逻辑。所述读缓冲逻辑用于接收所述读缓冲区使能信号、读缓冲区列号、读缓冲区列内偏移,并且根据这些信号读取所述缓冲区实体某一列的数据;所述初始化缓冲逻辑用于在初始化开始信号有效时对所述缓冲区实体进行初始化;所述更新缓冲逻辑用于在所述列移信号有效时,按列整体移动缓冲区实体,同时输出所述作用于多粒度存储器的信号组。本发明可以在滤波前对数据进行处理,在滤波时提供并行运算所需的数据,充分利用数据局部性原理,减少访存次数,达到数据的最大利用率。

    一种基于图描述语言的将二进制工具生成方法

    公开(公告)号:CN103218246A

    公开(公告)日:2013-07-24

    申请号:CN201310139561.5

    申请日:2013-04-19

    Abstract: 本发明提出了一种基于图描述语言的二进制工具生成方法。这种图描述语言以集中定义和分布定义混合的方式规定了指令集的文法和编码。图描述语言包含了节点(node)和边(edge)两种基本语言元素。节点描述指令集体系结构的部分属性,一个节点可以拥有若干个子节点。子节点更细致地刻画了指令集体系结构的属性。本发明在获得处理器指令集体系结构的图描述模型后,二进制工具生成器根据模型中的相关描述生成汇编器、反汇编器和链接器等二进制工具。

Patent Agency Ranking