-
公开(公告)号:CN112162855B
公开(公告)日:2022-07-29
申请号:CN202010998007.2
申请日:2020-09-21
Applicant: 南开大学
IPC: G06F9/50
Abstract: 本发明公开了基于页锁定内存的GPU页缺失处理方法、系统及介质,该方法通过在页锁定内存中建立对访问物理内存页的访问状态位图,对访问状态位图进行探测,提前检测GPU线程块需要访问的物理内存页是否在GPU端;当不存在时,则提前进行GPU的物理内存页迁移,避免了由于GPU内存页缺失批处理造成的性能浪费。可以在目前GPU缺页处理机制的基础上,省去等待缺页处理周期的过程,减少计算时间;尤其适用于待处理数据的存储量大于GPU内存时的应用场景。
-
公开(公告)号:CN112162855A
公开(公告)日:2021-01-01
申请号:CN202010998007.2
申请日:2020-09-21
Applicant: 南开大学
IPC: G06F9/50
Abstract: 本发明公开了基于页锁定内存的GPU页缺失处理方法、系统及介质,该方法通过在页锁定内存中建立对访问物理内存页的访问状态位图,对访问状态位图进行探测,提前检测GPU线程块需要访问的物理内存页是否在GPU端;当不存在时,则提前进行GPU的物理内存页迁移,避免了由于GPU内存页缺失批处理造成的性能浪费。可以在目前GPU缺页处理机制的基础上,省去等待缺页处理周期的过程,减少计算时间;尤其适用于待处理数据的存储量大于GPU内存时的应用场景。
-
公开(公告)号:CN112162854A
公开(公告)日:2021-01-01
申请号:CN202010996991.9
申请日:2020-09-21
Applicant: 南开大学
Abstract: 本发明公开了一种CPU‑GPU间计算任务调度方法、系统及介质,该方法在页锁定内存中构建若干数量的任务槽;所述任务槽的数量与GPU计算线程块的数量相同,且一一对应;将计算分成可同时执行的任务,进行动态分配;达到同一时间Kernel执行不同计算任务,提高GPU工作性能的目的。且无需升降硬件设备,充分利用GPU的并行线程数量和计算能力,可有效降低任务执行的时间,提高GPU资源利用率;尤其适用于GPU程序中有可并行执行任务的计算场景。
-
-