基于驱动封装的GPU分时共享方法及系统

    公开(公告)号:CN112506666A

    公开(公告)日:2021-03-16

    申请号:CN202011525125.8

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。

    一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置

    公开(公告)号:CN111783977B

    公开(公告)日:2024-04-05

    申请号:CN202010317520.0

    申请日:2020-04-21

    Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。

    一种基于混合内存架构的内存系统

    公开(公告)号:CN110532200B

    公开(公告)日:2023-08-01

    申请号:CN201910792500.6

    申请日:2019-08-26

    Abstract: 一种基于混合内存架构的内存系统,包括第一存储介质、第二存储介质和内存控制器,通过内存控制器获取近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,再依据被访问页面的权重值进行页面调度。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高,进而提高内存系统的工作效率。

    一种存储介质的热页预测方法和页面调度方法

    公开(公告)号:CN110795363B

    公开(公告)日:2023-05-23

    申请号:CN201910791493.8

    申请日:2019-08-26

    Abstract: 一种存储介质的热页预测方法和页面调度方法,通过获取存储介质中近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,其中访问信息包括访问次数和物理地址。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高。

    一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置

    公开(公告)号:CN111783977A

    公开(公告)日:2020-10-16

    申请号:CN202010317520.0

    申请日:2020-04-21

    Abstract: 本发明涉及一种基于分区域梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中将特定区域的输入激活值保存在内存中;在神经网络训练的反向传播过程中利用保存的特定区域的输入激活值计算梯度,以更新神经网络的权重参数。所述区域是在输入激活值的长度和宽度方向上划分的区域。通过分块步长和网络稠密度确定所述特定区域,首先根据分块步长对输入激活值划分区域,并确定区域起始位置,然后根据网络稠密度确定保留区域总数。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。

    一种存储介质的热页预测方法和页面调度方法

    公开(公告)号:CN110795363A

    公开(公告)日:2020-02-14

    申请号:CN201910791493.8

    申请日:2019-08-26

    Abstract: 一种存储介质的热页预测方法和页面调度方法,通过获取存储介质中近期N个被访问页面的访问信息,并依据当前被访问页面的访问信息和近期N个被访问页面的访问信息,获取当前被访问页面的权重值,并依据被访问页面的权重值对该被访问页面进行热页预测,其中访问信息包括访问次数和物理地址。由于依据访问信息中的访问次数和物理地址对被访问页面进行热页预测,使得热页预测的效率和准确率更高。

    一种处理器的性能调度方法及系统

    公开(公告)号:CN110389833A

    公开(公告)日:2019-10-29

    申请号:CN201910572132.4

    申请日:2019-06-28

    Abstract: 本申请提供一种处理器的性能调度方法及系统,该方法包括设置公式过程:设置适用于处理器内存子系统模型的IPC与MR(#L3way)、BW的计算式;求得优选值过程:依据计算式,确定目标IPC值所对应的MR(#L3way)与BW的优选取值。性能调度系统包括依次连接的输入单元、运算单元和设置单元。本申请提供的处理器的性能调度方法及系统,可以指导处理器上的内存带宽与第三级高速缓存资源的协同调度,针对性能优化目标,选择合适的内存带宽与第三级高速缓存。

    基于驱动封装的GPU分时共享方法及系统

    公开(公告)号:CN112506666B

    公开(公告)日:2024-08-23

    申请号:CN202011525125.8

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。

    一种处理器的性能调度方法及系统

    公开(公告)号:CN110389833B

    公开(公告)日:2023-06-16

    申请号:CN201910572132.4

    申请日:2019-06-28

    Abstract: 本申请提供一种处理器的性能调度方法及系统,该方法包括设置公式过程:设置适用于处理器内存子系统模型的IPC与MR(#L3way)、BW的计算式;求得优选值过程:依据计算式,确定目标IPC值所对应的MR(#L3way)与BW的优选取值。性能调度系统包括依次连接的输入单元、运算单元和设置单元。本申请提供的处理器的性能调度方法及系统,可以指导处理器上的内存带宽与第三级高速缓存资源的协同调度,针对性能优化目标,选择合适的内存带宽与第三级高速缓存。

    一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置

    公开(公告)号:CN111783976B

    公开(公告)日:2023-04-21

    申请号:CN202010317078.1

    申请日:2020-04-21

    Abstract: 本发明涉及一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中,选择部分通道的输入激活值保存在内存中;在神经网络训练的反向传播过程中,利用保存的部分通道的输入激活值计算梯度,以更新神经网络的权重参数。通过窗口选择所述部分通道,通过超参数网络稠密度决定窗口大小,即窗口内包含的通道数占总通道数的比例。通过窗口选择所述部分通道的步骤包括:确定窗口的起始位置;根据网络稠密度确定窗口大小。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。

Patent Agency Ranking