-
公开(公告)号:CN110796588B
公开(公告)日:2024-08-23
申请号:CN201910451751.8
申请日:2019-05-28
Applicant: 辉达公司
Inventor: R·达什 , G·帕尔默 , 广田源太郎 , L·姗 , J·肖凯特 , E·克里加里夫 , S·尼韦提 , M·雷 , S·加德雷 , O·帕兰杰佩 , 杨磊 , R·季米特洛夫
Abstract: 本发明提供了一种同时计算和图形调度。在一些示例中,描述了一种并行处理单元(例如,GPU),包括硬件调度器和硬件仲裁器,其启动用于在SIMD/SIMT处理单元上同时执行的图形工作和计算工作。并行处理单元的每个处理单元(例如,流式多处理器)在各个时间以图形贪婪模式或计算贪婪模式操作。硬件仲裁器响应于将至少一个所监控的性能或利用度量与用户配置的阈值进行比较的结果,可以选择性地:当处理单元在计算贪婪模式下操作时使处理单元运行来自计算队列的一个或更多个计算工作项,以及当处理单元在图形贪婪模式下操作使处理单元运行来自图形队列的一个或更多个图形工作项。还描述了相关联的方法和系统。
-
-
公开(公告)号:CN116775265A
公开(公告)日:2023-09-19
申请号:CN202210987028.3
申请日:2022-08-17
Applicant: 辉达公司
Inventor: G·帕尔默 , 广田源太郎 , R·克拉辛斯基 , 龙泽 , B·帕里斯 , R·达什 , J·塔基 , J·F·小杜鲁克 , L·姗 , L·杜兰特 , J·肖凯特 , E·韦尔奈斯 , N·戈维尔 , M·帕特尔 , S·德布 , S·纳瓦达 , J·埃德蒙森 , P·班加罗尔·普拉巴卡尔 , W·甘地 , R·马尼亚姆 , A·帕尔 , O·吉鲁 , S·加德雷 , S·海因里希
IPC: G06F9/50
Abstract: 公开了协作组阵列,具体描述了一个或更多个新的层次结构级别——协作组阵列(CGA)——以及关联的新的基于硬件的工作分配/执行模型。CGA是线程块的网格(也称为协作线程阵列(CTA))。CGA提供协同调度,例如,相对于应用程序所需的内存以及相对于彼此,控制CTA在处理器(诸如GPU)中的放置/执行位置。对此类CGA的硬件支持保证了并发性,并实现了应用程序在紧密协作的CTA集合中看到更多的数据局部性、减少的延时和所有线程之间更好的同步,所述CTA集合以可编程方式分布在不同的(例如,分层的)硬件域或分区上。
-
-
-
公开(公告)号:CN110796588A
公开(公告)日:2020-02-14
申请号:CN201910451751.8
申请日:2019-05-28
Applicant: 辉达公司
Inventor: R·达什 , G·帕尔默 , 广田源太郎 , L·姗 , J·肖凯特 , E·克里加里夫 , S·尼韦提 , M·雷 , S·加德雷 , O·帕兰杰佩 , 杨磊 , R·季米特洛夫
Abstract: 本发明提供了一种同时计算和图形调度。在一些示例中,描述了一种并行处理单元(例如,GPU),包括硬件调度器和硬件仲裁器,其启动用于在SIMD/SIMT处理单元上同时执行的图形工作和计算工作。并行处理单元的每个处理单元(例如,流式多处理器)在各个时间以图形贪婪模式或计算贪婪模式操作。硬件仲裁器响应于将至少一个所监控的性能或利用度量与用户配置的阈值进行比较的结果,可以选择性地:当处理单元在计算贪婪模式下操作时使处理单元运行来自计算队列的一个或更多个计算工作项,以及当处理单元在图形贪婪模式下操作使处理单元运行来自图形队列的一个或更多个图形工作项。还描述了相关联的方法和系统。
-
公开(公告)号:CN116774914A
公开(公告)日:2023-09-19
申请号:CN202210915158.6
申请日:2022-08-01
Applicant: 辉达公司
Inventor: P·班加罗尔·普拉巴卡尔 , 广田源太郎 , R·克拉辛斯基 , 龙泽 , B·帕里斯 , R·达什 , J·塔基 , J·F·小杜鲁克 , L·姗 , L·杜兰特 , J·肖凯特 , E·韦尔奈斯 , N·戈维尔 , M·帕特尔 , S·德布 , S·纳瓦达 , J·埃德蒙森 , G·帕尔默 , W·甘地 , R·马尼亚姆 , A·帕尔 , O·吉鲁 , S·加德雷 , S·海因里希
IPC: G06F3/06 , G06F15/167 , G06F9/50
Abstract: 公开了分布式共享存储器,其包括跨处理器(诸如GPU)分布或者分散的存储器块。在一个存储器块本地的处理核心上执行的线程能够访问不同处理核心本地的存储器块。在一个实施例中,通过处理核心之间的通信来实现对跨处理核心的集合分布的这些DSMEM分配的共享访问。这样的分布式共享存储器为位于存储器块附近的处理核心提供了非常低延时的存储器访问,并且还为更远的处理核心提供了也以这样的方式使用不干扰处理核心对诸如由L2高速缓存支持的主存储器或全局存储器的访问的互连访问存储器块的方式。这样的分布式共享存储器通过允许先前仅在同一处理核心内可能的数据共享和通信来支持跨多个处理核心的协作并行性和强扩展。
-
公开(公告)号:CN113010301A
公开(公告)日:2021-06-22
申请号:CN202011502659.9
申请日:2020-12-17
Applicant: 辉达公司
Abstract: 公开了用户定义的测定的优先级队列。以用户定义的级别优化处理器资源的设备、系统和技术。在至少一个实施例中,调整一个或更多个任务的优先级,以防止一个或更多个其他依赖任务由于缺少可消耗的资源而进入空闲状态。
-
-
-
-
-
-
-