多核处理器的数据管理方法及装置

    公开(公告)号:CN102446159B

    公开(公告)日:2013-09-18

    申请号:CN201010508870.1

    申请日:2010-10-12

    Abstract: 一种多核处理器的数据管理方法及装置,所述多核处理器包括处理器核心阵列和处理器核心互连结构,所述处理器核心阵列包括多个处理器核心,所述处理器核心包括具有多个存储单元的核内存储器,所述处理器核心互连结构用于所述处理器核心阵列中任意两处理器核心间的通信,所述方法包括:对所述处理器核心的核内存储器的存储单元分配存储地址;根据所述存储单元的存储地址在至少一个处理器核心的核内存储器和主存之间进行数据传输。本发明提高了数据的读写效率,利用批量化的访存方式,将多次数据访问合并,避免了零散访问主存的效率损失问题,并提供了多种编址方式和相应的数据传输方式,能够满足多种计算过程的应用需要。

    一种集群电源管理系统
    35.
    发明公开

    公开(公告)号:CN102932166A

    公开(公告)日:2013-02-13

    申请号:CN201210379888.5

    申请日:2012-10-09

    Abstract: 本发明提供的一种集群电源管理系统包括:一个或多个计算节点组,其中每个计算节点组包括多个计算节点;与所述多个计算节点组分别对应的多个电源管理模块,其中对于每个计算节点组,在该计算节点组单独使用时,计算节点组中的作为主计算节点的一个计算节点通过控制信号对相应的电源管理模块进行配置,进而管理本计算节点组;主控节点,其通过电源管理模块的唯一地址选择电源管理模块以便对该电源管理模块进行配置;电源管理网络,用于处理电源管理模块与主控节点的通信。

    一种计算机体系结构性能模拟方法及系统

    公开(公告)号:CN102760097A

    公开(公告)日:2012-10-31

    申请号:CN201110110819.X

    申请日:2011-04-29

    Abstract: 一种计算机体系结构性能模拟方法及系统,所述计算机体系结构性能模拟方法包括:建立包含目标应用的基本模块的应用抽象模型,所述基本模块包括基本计算模块和基本通信模块;根据目标机的体系结构特征,建立所述基本模块的体系结构抽象模型;建立包含通用模拟平台的体系结构性能模拟器,并将所述体系结构抽象模型以模块形式耦合至所述体系结构性能模拟器中,所述体系结构性能模拟器具有与所述应用抽象模型进行通信的模拟接口;调用所述模拟接口,以参数形式传递所述应用抽象模型的计算信息和通信信息,驱动所述体系结构性能模拟器完成目标机体系结构的性能模拟。所述模拟方法简化了性能模拟器实现,提升模拟速度,提高运行和配置的灵活性。

    一种用于异构计算的融合算子设计方法和异构计算系统

    公开(公告)号:CN115374912A

    公开(公告)日:2022-11-22

    申请号:CN202211038174.8

    申请日:2022-08-29

    Abstract: 本发明涉及计算机数据计算领域,具体涉及到异构计算系统的设计。本发明是通过以下技术方案得以实现的:一种用于异构计算的融合算子设计方法,包含如下步骤:S01、归一化算子划分步骤;在该步骤中,将归一化算子划分成和计算算子与线性缩放算子两个算子,S02、算子融合步骤;依次将所述线性缩放算子、激活算子、卷积算子、所述和计算算子组成一个融合算子。本发明的目的是提供一种用于异构计算的融合算子设计方法和异构计算系统,在保证操作的正确性和操作种类不变的情况下,对算子的融合方式进行全新的设计和拆分,使得大量计算过程的数据交互均在片上进行,优化数据交互的带宽使用效率。

    一种支持cache更新的一致性加速处理方法

    公开(公告)号:CN115269200A

    公开(公告)日:2022-11-01

    申请号:CN202210977978.8

    申请日:2022-08-16

    Abstract: 本发明涉及计算机数据计算领域,具体处理器多核处理的加速方法。本发明是通过以下技术方案得以实现的:一种支持cache更新的一致性加速处理方法,包含如下步骤:S01、生产核心数据生产步骤;生产核心生产出批量数据;S02、完成通知即时发送步骤;所述生产核心给一致性串行点发送完成通知;S03、串行点取数据步骤;所述一致性串行点从所述生产核心处获得刚处理完的数据,且将数据转存到主存中,在转存结束之前,该生产核心不生产新的数据;S04、消费核心获得数据步骤。本发明的目的是提供一种支持cache更新的一致性加速处理方法,在保证cache一致性的基础上,解决一致性操作的延迟开销,避免生产核心的多任务竞争,减少数据处理的延迟,提升效率。

    一种张量、向量、标量计算加速和数据调度系统

    公开(公告)号:CN115169541A

    公开(公告)日:2022-10-11

    申请号:CN202210986917.8

    申请日:2022-08-17

    Abstract: 一种张量、向量、标量计算加速和数据调度系统,属于高性能计算技术领域。本发明包括:标量处理单元:用于取指和译码,以及发送指令;向量处理单元:用于接收来自标量处理单元的向量指令,完成向量类型数据的调度和计算;张量处理单元:用于接收来自标量处理单元的张量指令,完成张量类型数据的调度和计算;多端口本地数据存储单元:用于存储不同处理单元处理的数据,并支持不同处理单元对自身处理数据的同时读写;多功能直接内存访问单元:用于实现内存到各个功能单元之间的数据通信;在线远程存储访问单元:用于实现不同处理单元间数据的直接交互。本发明能够有效提升复杂算法中张量计算、向量计算、标量计算的算力和数据调度的灵活性。

    一种超长点数高性能FFT计算装置

    公开(公告)号:CN112163187A

    公开(公告)日:2021-01-01

    申请号:CN202011290004.X

    申请日:2020-11-18

    Abstract: 本发明涉及数字信号处理领域,具体涉及一种超长点数超高性能FFT计算装置。本发明通过以下技术方案得以实现的:一种超长点数超高性能FFT计算装置,包含FFT计算模块和控制单元,所述FFT计算模块数量为两个,分别为计算模块一和计算模块二;还包含两个三维转置存储器和二维转置存储器;三维转置存储器一的数据输入端连接主存,数据输出端连接计算模块一;所述二维转置存储器的数据输入端连接所述计算模块一,数据输出端连接所述计算模块二。本发明的目的是提供一种超长点数超高性能FFT计算装置,通过全新的数据转置处理方式,增加数据平滑性,使得FFT数据处理过程中数据带宽利用率高,大大增加处理效率。

Patent Agency Ranking