-
公开(公告)号:CN110502334A
公开(公告)日:2019-11-26
申请号:CN201810471957.2
申请日:2018-05-17
Applicant: 上海交通大学
Abstract: 本发明提供一种基于混合内存架构的带宽感知任务窃取方法、系统及芯片,所述系统包括:内存分配模块,根据各个内存节点的带宽大小成比例的将程序数据分配到各个内存节点上;带宽感知的平衡访存模块,获得数据页的热度信息,估算出每个内存节点的访存信息并根据所述热度信息和所述访存信息将过载节点上的数据页迁移到相应的欠载节点上;多层次任务窃取模块,为每一个子任务确定最优的CPU,当任一子任务的CPU完成分配给它的任务后,从任务池中进行多层任务窃取。本发明可以在相同异构多核架构中获取更低的能耗,在无需升级硬件设备与不增加能耗的提前下,极大化并行计算性能,可以间接为潜在的混合内存架构的多核芯片提供调度技术的支持。
-
公开(公告)号:CN104411824B
公开(公告)日:2017-12-26
申请号:CN201280074086.1
申请日:2012-06-18
Applicant: 山东大学 , 山东山大附属生殖医院有限公司 , 上海交通大学
CPC classification number: C12Q1/6883 , C12Q2600/156 , C12Q2600/16
Abstract: 本发明提供与PCOS相关的SNP标记、用于检测所述SNP标记的探针、芯片、引物、试剂盒和方法。另外,本发明还提供所述探针、芯片和引物在预测和诊断PCOS风险中的应用。
-
公开(公告)号:CN118916156A
公开(公告)日:2024-11-08
申请号:CN202410946115.3
申请日:2024-07-15
Applicant: 上海交通大学
Abstract: 一种基于自适应并行共优化的大模型异构集群调度系统及方法,包括:基于执行流建模的性能分析器、集群弹性抢占式任务调度器以及任务并行执行引擎,其中:集群弹性抢占式任务调度器根据任务队列动态改变任务的计算资源,得到不同集群任务负载下近似最优的任务资源分配;性能分析器根据来自集群弹性抢占式任务调度器的模型并行块和来自异构GPU集群的硬件信息,进行单设备上的并行块算子延迟测量,估计得到每一个并行块所定义的子空间内最优并行策略的迭代时间;任务并行执行引擎接收调度后的并行块进行基于剪枝后搜索空间下的并行搜索、生成任务及其最优并行策略后输出至异构GPU集群。本发明保证了多个大模型训练任务的高效性能分析,集群级别的吞吐性能和资源利用率提高以及任务级别的任务完成时间减少。
-
公开(公告)号:CN114003359B
公开(公告)日:2024-07-16
申请号:CN202111230110.3
申请日:2021-10-20
Applicant: 上海交通大学
Abstract: 本发明提供一种基于弹性持久的线程块的任务调度方法、系统及GPU,所述基于弹性持久的线程块的任务调度方法包括:对于每一个GPU内核函数,使用源对源编译的方式将该内核函数,转换为使用弹性持久线程块的函数版本,进而减少了内核函数的资源占用。对于每一个可能的混跑的内核函数对,使用混跑重合率判断两个混跑的内核函数的吞吐性能,进而找到最优的混跑配置。对于实时到来的内核函数,基于混跑重合率来构建混跑的内核函数对,以获得最大的吞吐。本发明可以在无需用户感知的前提下,最大化系统吞吐,本发明的成果可以间接为潜在的配置多种计算单元的GPU提供调度技术的支持。
-
公开(公告)号:CN113407333B
公开(公告)日:2023-05-26
申请号:CN202011506442.5
申请日:2020-12-18
Applicant: 上海交通大学
Abstract: 本发明提供一种Warp级别调度的任务调度方法、系统、GPU及设备,所述Warp级别调度的任务调度方法包括:在任务为首次任务时,离线分析用户提交任务的硬件信息及配置信息;基于所述任务的硬件信息和配置信息,获取与主流任务并行时的最大并行度;在任务为非首次任务时,基于任务的硬件信息和已收集的最大并行度决策,进行在线的任务对打包决策,将选取的任务对打包成一个新任务,并将新任务提交到GPU上,以使得任务对中的原有两个GPU任务实现warp级别的任务调度。本发明在无需用户感知提前下,实现高吞吐的Warp级别调度的任务调度,可以间接为潜在的配置多种计算单元的GPU提供调度技术的支持。
-
公开(公告)号:CN114003359A
公开(公告)日:2022-02-01
申请号:CN202111230110.3
申请日:2021-10-20
Applicant: 上海交通大学
Abstract: 本发明提供一种基于弹性持久的线程块的任务调度方法、系统及GPU,所述基于弹性持久的线程块的任务调度方法包括:对于每一个GPU内核函数,使用源对源编译的方式将该内核函数,转换为使用弹性持久线程块的函数版本,进而减少了内核函数的资源占用。对于每一个可能的混跑的内核函数对,使用混跑重合率判断两个混跑的内核函数的吞吐性能,进而找到最优的混跑配置。对于实时到来的内核函数,基于混跑重合率来构建混跑的内核函数对,以获得最大的吞吐。本发明可以在无需用户感知的前提下,最大化系统吞吐,本发明的成果可以间接为潜在的配置多种计算单元的GPU提供调度技术的支持。
-
公开(公告)号:CN102918158B
公开(公告)日:2014-05-28
申请号:CN201080067164.6
申请日:2010-05-31
Applicant: 山东大学 , 山东山大附属生殖医院有限公司 , 上海交通大学
CPC classification number: C12Q1/6886 , C12Q1/6883 , C12Q2600/156 , C12Q2600/172
Abstract: 本发明提供了与多囊卵巢综合征(PCOS)相关的SNP,这些SNP在数以千计的中国PCOS病例中被发现。本发明还提供了具有所述SNP的探针和包括一个或多个这些探针的芯片。所述探针和芯片可以用于筛选、预测或诊断PCOS。
-
-
-
-
-
-