基于驱动封装的GPU分时共享方法及系统

    公开(公告)号:CN112506666A

    公开(公告)日:2021-03-16

    申请号:CN202011525125.8

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。

    一种基于采样的应用程序CPU末级高速缓存缺失率曲线的预测方法

    公开(公告)号:CN111258927A

    公开(公告)日:2020-06-09

    申请号:CN201911309038.6

    申请日:2019-12-18

    Abstract: 本发明提出一种基于采样的应用程序CPU末级高速缓存缺失率曲线的预测方法,属于计算机体系结构领域,包括以下步骤:让目标程序在处理器上运行,设计一组访存模式可控的微程序来访问指定末级高速缓存LLC组,与目标程序在指定LLC组发生资源竞争;通过采样收集一段时间内不同LLC组上的缓存缺失数量;通过控制微程序的访存模式改变它所占用的缓存块数量,改变目标程序所在指定LLC组上占用的缓存大小;计算未被微程序影响的LLC组上的缓存缺失数与受影响的组上缓存缺失数之差,据此得到目标程序的缺失率曲线。本方法既能消除事离线探测方法的局限性,又能避免在线预测方法对程序性能的干扰。

    一种基于混合内存架构的内存系统

    公开(公告)号:CN110532200A

    公开(公告)日:2019-12-03

    申请号:CN201910792500.6

    申请日:2019-08-26

    Abstract: 一种基于混合内存架构的内存系统,包括第一存储介质、第二存储介质和内存控制器,通过内存控制器获取近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,再依据被访问页面的权重值进行页面调度。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高,进而提高内存系统的工作效率。

    一种计算机系统内存带宽调度方法、系统及存储介质

    公开(公告)号:CN110287014A

    公开(公告)日:2019-09-27

    申请号:CN201910566072.5

    申请日:2019-06-27

    Abstract: 本发明涉及数据处理技术领域,具体涉及一种计算机系统内存带宽调度方法、系统及存储介质,其中方法包括:获取当前系统物理核上运行的每个程序的性能信息和其所占用的初始带宽;对所有程序按照其所占用的初始带宽的大小进行聚类处理,将其分成带宽污染型和带宽敏感型,对带宽污染型中的至少部分程序进行限流处理,判断限流处理后系统整体的性能是否提高,若否则结束调度;若限流处理后系统整体的性能有提高,则对带宽敏感型中所有程序重新进行聚类处理,重复上述步骤,直到结束调度。本申请的内存带宽调度方法优先对占用内存带宽较大的程序进行限流,保证了多核计算机系统可以同时部署多个程序,且提高了系统整体的性能。

    一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置

    公开(公告)号:CN111783977B

    公开(公告)日:2024-04-05

    申请号:CN202010317520.0

    申请日:2020-04-21

    Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。

    一种基于混合内存架构的内存系统

    公开(公告)号:CN110532200B

    公开(公告)日:2023-08-01

    申请号:CN201910792500.6

    申请日:2019-08-26

    Abstract: 一种基于混合内存架构的内存系统,包括第一存储介质、第二存储介质和内存控制器,通过内存控制器获取近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,再依据被访问页面的权重值进行页面调度。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高,进而提高内存系统的工作效率。

    一种存储介质的热页预测方法和页面调度方法

    公开(公告)号:CN110795363B

    公开(公告)日:2023-05-23

    申请号:CN201910791493.8

    申请日:2019-08-26

    Abstract: 一种存储介质的热页预测方法和页面调度方法,通过获取存储介质中近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,其中访问信息包括访问次数和物理地址。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高。

    一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置

    公开(公告)号:CN111783977A

    公开(公告)日:2020-10-16

    申请号:CN202010317520.0

    申请日:2020-04-21

    Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。

    一种存储介质的热页预测方法和页面调度方法

    公开(公告)号:CN110795363A

    公开(公告)日:2020-02-14

    申请号:CN201910791493.8

    申请日:2019-08-26

    Abstract: 一种存储介质的热页预测方法和页面调度方法,通过获取存储介质中近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,其中访问信息包括访问次数和物理地址。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高。

Patent Agency Ranking