-
公开(公告)号:CN114327808A
公开(公告)日:2022-04-12
申请号:CN202110425774.9
申请日:2021-04-20
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种自适应任务调度方法,包括在课题开始运行后运行时系统对计算资源进行初始化,初始化节点类型,划分区域,选取节点类型,初始化任务池;课题正式运行时进行任务分配与调度,随着叶子计算节点完成任务后动态生成新任务并进行调度,当叶子计算节点完成某一任务计算且动态产生新的任务时,叶子节点选择第一个新任务继续进行计算,并通过消息回报其余新产生任务(如果存在)给区域主节点,全局主节点采用消息对各区域任务池进行探测,当某一区域任务显著高于其余区域时,对该区域任务进行回收,进入动态子任务任务池。本发明可避免课题运算过程中动态生成的任务导致负载不均衡的现象,提升计算资源的利用率和课题解算效率。
-
公开(公告)号:CN112738142A
公开(公告)日:2021-04-30
申请号:CN201910974455.6
申请日:2019-10-14
Applicant: 无锡江南计算技术研究所
IPC: H04L29/08
Abstract: 本发明公开了一种面向众核多层次存储系统的数据高效传输支持方法,包括典型访存通信模式性能库和运行时最优模式选择模块,所述典型访存通信模式性能库是通过以下步骤构建形成的,总结科学计算程序中的典型通信访存模式;对每种典型通信访存模式,用多种通信访存方案具体实现;对每种实现通信访存方案,测试在不同数据规模下的性能以及需要的缓冲空间的大小,构建典型访存通信模式性库;所述运行时最优模式选择模块则根据用户程序的访存通信模式、访存数据量、可用缓冲空间大小信息,搜索典型访存通信模式性库,选择最优实现方案。本发明减轻编程人员负担的同时,提供高效的实现方案,对于不了解存储系统细节的编程人员,也能很好的利用系统特性。
-
公开(公告)号:CN112631693A
公开(公告)日:2021-04-09
申请号:CN201910903881.0
申请日:2019-09-24
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种运行时计算资源动态扩展方法,发送资源扩展升级命令给正在运行的原课题;原节点接到升级信号后,进行通信环境清理;等待新进计算资源进行二次通信环境重构通信;新节点由作业管理启动程序,进入动态任务划分区域中;判断为资源升级新节点后,新节点进行通信环境清理;原节点与新节点进行二次通信环境重构;新节点按照动态任务划分规则自动进行分区,选取分区主节点,由分区主节点向全局主节点申请任务;全局主节点在接到原分区和新分区主节点的任务申请后,向原计算资源节点和新计算资源节点均匀分配任务,课题继续正常运行。本发明解决资源调整后的通信环境重构问题,在不中断已运行课题的基础上将空闲的计算资源分配给该课题,并动态分配未完成的任务,达到计算资源的最大化利用。
-
公开(公告)号:CN109067752B
公开(公告)日:2021-03-26
申请号:CN201810928706.2
申请日:2018-08-15
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开一种利用RDMA消息实现兼容TCP/IP协议的方法,该方法利用RDMA消息传输IP数据报文,实现对TCP/IP协议的兼容,可以获得比传统的利用Send/Recv传输IP报文更高的消息性能。本发明通过rdmabuf通告及补充机制,预先分配rdmabuf,以降低消息延迟;通过rdmabuf失效方法,在发送端可以避免使用无效的rdmabuf,在接收端可以节省内存消耗;采用rdmabuf池机制,预先分配rdmabuf,提高rdmabuf的使用效率。
-
公开(公告)号:CN112445547A
公开(公告)日:2021-03-05
申请号:CN201910822171.5
申请日:2019-09-02
Applicant: 无锡江南计算技术研究所
IPC: G06F9/448 , G06F15/163
Abstract: 本发明公开一种面向异构众核处理器的低扰动性能数据采集方法,用于国产众核处理器,包括以下步骤:S1、在主核设置需要采集的性能数据所对应的性能事件,并对性能事件进行分类;S2、通过CSR寄存器设置硬件计数器的初值、计数使能控制、计数事件的选择,即将性能事件选择为计数事件,以实现对硬件计数器的初始化;S3、用户对需要进行性能数据采集的程序段进行插装,通过计算获得该程序段触发该性能事件的次数为两次统计接口函数的差值;S4、主核通过读取保存在统计接口参数地址中的性能事件的计数值实现性能数据的采集。本发明可以对多类性能事件进行并行采集,大大提高了数据采集效率,实现了高效全面、对程序低扰动的性能数据采集。
-
公开(公告)号:CN105391658B
公开(公告)日:2018-07-06
申请号:CN201510830368.5
申请日:2015-11-24
Applicant: 无锡江南计算技术研究所
IPC: H04L12/933 , H04L12/947
Abstract: 本发明提供了一种基于物理位置感知的集合通信方法,包括:感知目的进程的位置;在目的进程和位于同一物理芯片内时,通过查询确定本地运算核心是否空闲;在本地运算核心空闲的情况下,通过本地运算核心发起存储器直接访问操作,将通信数据直接写入所述同一物理芯片上的目的进程主存中,以使得所述同一物理芯片内的通信不需要再通过网络接口进行中转。本发明进行大规模集合通信时,通过感知目的进程的位置,结合路由芯片路由算法,根据无端口冲突原则,使得通信间的路由冲突最小化。
-
公开(公告)号:CN106709048A
公开(公告)日:2017-05-24
申请号:CN201710006054.2
申请日:2017-01-05
Applicant: 无锡江南计算技术研究所
IPC: G06F17/30
Abstract: 一种面向高性能计算的分布式数据组织方法,在接口层将数据访问和数据管理分离开来;在计算节点端,客户端仅向应用程序提供精简的数据访问接口,支持对应用完全透明的POSIX形式的文件访问操作。本发明针对高性能计算应用的数据存储需求,对POSIX文件系统访问语义进行了精简,解耦数据访问和数据管理,为应用程序提供高效、轻量级的编程接口;采用分布式对象存储技术进行数据组织,突破传统文件系统数据组织限制,实现更为高效的数据访问协议,进一步提升系统可扩展能力;提出基于内存的元数据管理方式,首次将高性能非关系键值数据库引入高性能计算机系统,利用其优良特性对外提供高效可扩展的元数据服务。
-
公开(公告)号:CN102929707B
公开(公告)日:2015-10-07
申请号:CN201210438264.6
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种并行任务动态分配方法,适用于包括多级用户进程的并行系统,所述多级用户进程包括至少两级主进程和普通进程。该方法包括:主进程将本级待分配的并行任务排序,形成本级待分配任务队列;接收下一级用户进程发送的任务请求消息及所请求的任务数量;从本级待分配任务队列的队首开始,按照下一级用户进程所请求的任务数量,为下一级用户进程分配任务,并更新本级待分配任务队列。本发明可提高动态任务分配的效率,以达到众多计算资源间的负载平衡。
-
公开(公告)号:CN102981836B
公开(公告)日:2015-08-12
申请号:CN201210438958.X
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 一种异构系统的编译方法和编译器,其中,所述的异构系统的编译方法包括:识别系统服务语句,分离计算语句和所述系统服务语句,对所述系统服务语句进行标识;对系统服务语句进行格式解析,收集系统服务信息数据;在从核程序中生成第一语句,将所述系统服务信息数据打包传送到主核端I/O缓冲,并向主核端发送服务请求;在主核程序中生成第二语句,包括从核计算加载服务程序和与所述服务请求相应的系统服务程序;在所述主核程序中生成第三语句,根据所述标识对所述系统服务程序进行轮询处理,并依据所述主核端I/O缓冲中的数据处理所述系统服务程序。本发明的异构系统的编译方法和编译器,在异构系统上实现了用户层同构视角的编程。
-
公开(公告)号:CN102981839A
公开(公告)日:2013-03-20
申请号:CN201210441329.2
申请日:2012-11-06
Applicant: 无锡江南计算技术研究所
Abstract: 本发明公开了一种合并执行大规模并行线程的数据扩展优化方法,包括:在合并执行的并行线程中识别线程不变量;所述线程不变量在每个合并执行的并行线程中保持一致;编译过程中,仅对非线程不变量,进行数据扩展。本发明减少了不必要的线程私有数据扩展,能有效缓解合并后栈空间的剧烈膨胀,提高程序的执行效率。
-
-
-
-
-
-
-
-
-