-
公开(公告)号:CN112445610A
公开(公告)日:2021-03-05
申请号:CN202010213365.8
申请日:2020-03-24
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
IPC: G06F9/50
Abstract: 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN110096341B
公开(公告)日:2023-07-11
申请号:CN201910100193.0
申请日:2019-01-31
Applicant: 辉达公司
Abstract: 本发明公开了执行资源的动态分区。本发明的实施例提供用以向在图形处理单元中的线程组分配执行资源的技术。包括在所述图形处理单元中的计算工作分配器接收来自进程的指示,其指示将启动第一线程组。计算工作分配器确定与所述进程相关联的第一子上下文具有至少一个处理器信用。在一些实施例中,如果TPC中的一个已经获取了充足的空间,即使在没有处理器信用的情况下也可以启动CTA。计算工作分配器标识第一处理器,其包括在多个处理器中并具有的处理负载小于或等于与包括在多个处理器中的其他处理器相关联的处理器负载。计算工作分配器启动所述第一线程组以在所述第一处理器上执行。
-
公开(公告)号:CN112445611B
公开(公告)日:2025-05-06
申请号:CN202010214099.0
申请日:2020-03-24
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
IPC: G06F9/50
Abstract: 本并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN110096341A
公开(公告)日:2019-08-06
申请号:CN201910100193.0
申请日:2019-01-31
Applicant: 辉达公司
Abstract: 本发明公开了执行资源的动态分区。本发明的实施例提供用以向在图形处理单元中的线程组分配执行资源的技术。包括在所述图形处理单元中的计算工作分配器接收来自进程的指示,其指示将启动第一线程组。计算工作分配器确定与所述进程相关联的第一子上下文具有至少一个处理器信用。在一些实施例中,如果TPC中的一个已经获取了充足的空间,即使在没有处理器信用的情况下也可以启动CTA。计算工作分配器标识第一处理器,其包括在多个处理器中并具有的处理负载小于或等于与包括在多个处理器中的其他处理器相关联的处理器负载。计算工作分配器启动所述第一线程组以在所述第一处理器上执行。
-
公开(公告)号:CN112445611A
公开(公告)日:2021-03-05
申请号:CN202010214099.0
申请日:2020-03-24
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
IPC: G06F9/50
Abstract: 本并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN112445609A
公开(公告)日:2021-03-05
申请号:CN202010196535.6
申请日:2020-03-19
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
Abstract: 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN112445608A
公开(公告)日:2021-03-05
申请号:CN202010196003.2
申请日:2020-03-19
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
IPC: G06F9/50
Abstract: 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN112445609B
公开(公告)日:2025-03-28
申请号:CN202010196535.6
申请日:2020-03-19
Applicant: 辉达公司
Inventor: 杰尔姆·F·小杜鲁克 , G·S·帕尔默 , J·S·R·埃万斯 , S·辛格 , S·H·邓肯 , W·A·甘地 , L·V·姗 , E·罗克 , 苏斐琦 , J·L·德明 , A·梅内塞斯 , P·维迪雅 , P·乔吉尼帕里 , T·J·珀塞尔 , M·曼达尔
Abstract: 并行处理单元(PPU)可以被分为多个分区。每个分区被配置为与整个PPU操作类似的操作。给定分区包括与整个PPU关联的计算和存储资源的子集。在CPU上执行的软件将管理员用户的PPU分区。访客用户被分配给一个分区,并且所述访客用户可以与分配给任何其他分区的任何其他访客用户隔离地在该分区内执行处理任务。因为PPU可以被分为隔离的分区,所以多个CPU进程可以有效地利用PPU资源。
-
公开(公告)号:CN110825596B
公开(公告)日:2024-08-06
申请号:CN201910549175.0
申请日:2019-06-24
Applicant: 辉达公司
Abstract: 本发明提供了一种具有分布式时钟的集成电路的高效性能监控。性能监视器设置在集成电路的不同时钟域中的计算单元上。中央调度器生成性能监视器的触发信号,以使性能监视器采用报告相关计算单元的本地性能计数的分组响应触发信号。分组中的数据被关联到单个时钟域中。通过应用触发和报告系统,所公开的方法可以同步不同时钟域中的各个计算单元的性能度量,而不必将复杂的全局时钟参考信号路由到所有性能监视器。
-
公开(公告)号:CN116795623A
公开(公告)日:2023-09-22
申请号:CN202211333238.7
申请日:2022-10-28
Applicant: 辉达公司
Inventor: P·维迪雅 , A·梅内塞斯 , S·沙玛 , 欧阳晋 , 格雷戈里·保罗·史密斯 , T·J·麦克唐纳 , S·卡马拉普卡 , A·罗纳德 , 托马斯·梅尔文·奥格蒂
Abstract: 本公开涉及生成功率高效的安全多客户端性能监控数据。各种实施例包括一种用于在计算系统中生成性能监控数据的系统。该系统包括具有一组计数器的单元级计数器,其中每个计数器在对应的电子信号处于第一状态(例如高或低逻辑电平状态)的每个时钟周期期间递增。周期性地,单元级计数器将计数器值传送到对应的计数器收集单元。计数器收集单元包括一组计数器,其聚合多个单元级计数器中的计数器的值。基于某些触发条件,计数器收集单元将记录传输到归约通道。归约通道包括一组计数器,这些计数器在多个计数器收集单元中聚合计数器的值。在系统上执行的每个虚拟机都可以访问不同的对应归约通道,从而为每个虚拟机提供安全的性能度量数据。
-
-
-
-
-
-
-
-
-