-
公开(公告)号:CN110389833A
公开(公告)日:2019-10-29
申请号:CN201910572132.4
申请日:2019-06-28
Applicant: 北京大学深圳研究生院 , 鹏城实验室
IPC: G06F9/50
Abstract: 本申请提供一种处理器的性能调度方法及系统,该方法包括设置公式过程:设置适用于处理器内存子系统模型的IPC与MR(#L3way)、BW的计算式;求得优选值过程:依据计算式,确定目标IPC值所对应的MR(#L3way)与BW的优选取值。性能调度系统包括依次连接的输入单元、运算单元和设置单元。本申请提供的处理器的性能调度方法及系统,可以指导处理器上的内存带宽与第三级高速缓存资源的协同调度,针对性能优化目标,选择合适的内存带宽与第三级高速缓存。
-
公开(公告)号:CN112506666B
公开(公告)日:2024-08-23
申请号:CN202011525125.8
申请日:2020-12-22
Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。
-
公开(公告)号:CN110389833B
公开(公告)日:2023-06-16
申请号:CN201910572132.4
申请日:2019-06-28
Applicant: 北京大学深圳研究生院 , 鹏城实验室
IPC: G06F9/50
Abstract: 本申请提供一种处理器的性能调度方法及系统,该方法包括设置公式过程:设置适用于处理器内存子系统模型的IPC与MR(#L3way)、BW的计算式;求得优选值过程:依据计算式,确定目标IPC值所对应的MR(#L3way)与BW的优选取值。性能调度系统包括依次连接的输入单元、运算单元和设置单元。本申请提供的处理器的性能调度方法及系统,可以指导处理器上的内存带宽与第三级高速缓存资源的协同调度,针对性能优化目标,选择合适的内存带宽与第三级高速缓存。
-
公开(公告)号:CN111783976B
公开(公告)日:2023-04-21
申请号:CN202010317078.1
申请日:2020-04-21
IPC: G06N3/084 , G06N3/08 , G06N3/0985 , G06N3/0464
Abstract: 本发明涉及一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中,选择部分通道的输入激活值保存在内存中;在神经网络训练的反向传播过程中,利用保存的部分通道的输入激活值计算梯度,以更新神经网络的权重参数。通过窗口选择所述部分通道,通过超参数网络稠密度决定窗口大小,即窗口内包含的通道数占总通道数的比例。通过窗口选择所述部分通道的步骤包括:确定窗口的起始位置;根据网络稠密度确定窗口大小。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
公开(公告)号:CN110287014B
公开(公告)日:2022-12-09
申请号:CN201910566072.5
申请日:2019-06-27
Applicant: 北京大学深圳研究生院 , 鹏城实验室
Abstract: 本发明涉及数据处理技术领域,具体涉及一种计算机系统内存带宽调度方法、系统及存储介质,其中方法包括:获取当前系统物理核上运行的每个程序的性能信息和其所占用的初始带宽;对所有程序按照其所占用的初始带宽的大小进行聚类处理,将其分成带宽污染型和带宽敏感型,对带宽污染型中的至少部分程序进行限流处理,判断限流处理后系统整体的性能是否提高,若否则结束调度;若限流处理后系统整体的性能有提高,则对带宽敏感型中所有程序重新进行聚类处理,重复上述步骤,直到结束调度。本申请的内存带宽调度方法优先对占用内存带宽较大的程序进行限流,保证了多核计算机系统可以同时部署多个程序,且提高了系统整体的性能。
-
公开(公告)号:CN111258927B
公开(公告)日:2022-05-03
申请号:CN201911309038.6
申请日:2019-12-18
IPC: G06F12/0802 , G06F12/0893
Abstract: 本发明提出一种基于采样的应用程序CPU末级高速缓存缺失率曲线的预测方法,属于计算机体系结构领域,包括以下步骤:让目标程序在处理器上运行,设计一组访存模式可控的微程序来访问指定末级高速缓存LLC组,与目标程序在指定LLC组发生资源竞争;通过采样收集一段时间内不同LLC组上的缓存缺失数量;通过控制微程序的访存模式改变它所占用的缓存块数量,改变目标程序所在指定LLC组上占用的缓存大小;计算未被微程序影响的LLC组上的缓存缺失数与受影响的组上缓存缺失数之差,据此得到目标程序的缺失率曲线。本方法既能消除事离线探测方法的局限性,又能避免在线预测方法对程序性能的干扰。
-
公开(公告)号:CN112817722A
公开(公告)日:2021-05-18
申请号:CN202110141136.4
申请日:2021-02-01
Abstract: 本发明公开了一种基于优先级的分时调度方法、终端及存储介质,方法包括:确定各个待调度任务的所属用户;获取第一预设时长内各个用户已运行任务的时长,根据各个用户已运行任务的时长在各个待调度任务中确定目标任务;为目标任务分配运行资源。本发明在对各个用户的任务进行调度时,根据一定时长内各个用户已经运行任务的时长确定当前需要被分配运行资源的任务,可以实现各个用户的任务完成进度更平均。
-
公开(公告)号:CN111783976A
公开(公告)日:2020-10-16
申请号:CN202010317078.1
申请日:2020-04-21
Abstract: 本发明涉及一种基于窗口梯度更新的神经网络训练过程中间值存储压缩方法和装置。该方法在神经网络训练的前向传播过程中,选择部分通道的输入激活值保存在内存中;在神经网络训练的反向传播过程中,利用保存的部分通道的输入激活值计算梯度,以更新神经网络的权重参数。通过窗口选择所述部分通道,通过超参数网络稠密度决定窗口大小,即窗口内包含的通道数占总通道数的比例。通过窗口选择所述部分通道的步骤包括:确定窗口的起始位置;根据网络稠密度确定窗口大小。本发明对神经网络训练时需要保存的激活值进行存储优化,能够大幅降低内存成本,提高训练深度更深、规模更大的神经网络的能力,同时也可以在内存受限的设备上在线训练网络。
-
公开(公告)号:CN113297102B
公开(公告)日:2022-07-12
申请号:CN202110510282.X
申请日:2021-05-11
Applicant: 北京大学
IPC: G06F12/0897 , G06F12/0871 , G06K9/62 , G06N20/00
Abstract: 本发明公开了一种基于地址过滤的动态缓存失效率曲线生成方法。本方法的步骤包括:1)将访存序列数据集中的各访存序列划分到各缓存组上,然后计算每个缓存组上的缓存失效率曲线;2)计算每个缓存组上的缓存失效率曲线与每一访存序列的真实缓存失效率曲线之间的距离,得到N*S个距离;3)从缓存组的维度将该N*S个距离划分为S个样本并对其进行聚类处理,保留平均距离小于设定阈值的k类缓存组;4)从访存序列的维度将该N*S个距离划分为N个样本,将k类缓存组上的距离作为每个样本的特征并聚类处理,根据分类结果选取出若干个缓存组;5)在线采集所选取缓存组上的访存序列;6)基于所采集的访存序列计算缓存失效率曲线。
-
公开(公告)号:CN108153585B
公开(公告)日:2021-08-20
申请号:CN201711249478.8
申请日:2017-12-01
Applicant: 北京大学
IPC: G06F9/48
Abstract: 本发明涉及一种基于局部性表达函数优化MapReduce框架的运行效率的方法和装置。该方法在Map阶段之前建立局部性表达函数,局部性表达函数通过实数值的大小关系表达局部性;在Map阶段根据计算出的局部性表达函数的值进行数据的加载,将不同数据按照局部性表达函数的数值区间分配给不同的计算节点来进行运算。在多轮MapReduce任务中,将局部性表达函数的值作为中间结果附带在Map和Reduce阶段,并在各个计算节点之间传递,以迭代计算局部性表达函数的值,在达到设定的收敛阈值之后,按照局部性表达函数的数值区间进行数据的重新分布。本发明的目的是通过局部性表达函数优化MapReduce框架的运行效率。
-
-
-
-
-
-
-
-
-