一种基于6D-Torus网络的作业调度方法和装置

    公开(公告)号:CN108494845B

    公开(公告)日:2020-12-22

    申请号:CN201810210221.X

    申请日:2018-03-14

    Abstract: 本发明公开了一种基于6D‑Torus网络的作业调度方法和装置,该作业调度方法包括:根据预设的命名规则,对每个节点进行命名,以得到每个节点的节点名;根据Hilbert曲线和节点名,将所有节点进行排序,以得到所有节点的一维向量;根据作业的资源请求和一维向量,选择运行节点并分配资源。本发明通过根据预设的命名规则,对每个节点进行命名,以得到每个节点的节点名,随后根据Hilbert曲线和节点名,将所有节点进行排序,以得到所有节点的一维向量,最后根据作业的资源请求和一维向量,选择运行节点并分配资源,从而利用Hilbert曲线,在3D‑Torus网络的基础上实现6D‑Torus网络的支持,优化作业在6D‑Torus网络的调度算法,其还能有效避免高维Hilbert曲线大计算量带来的性能等问题。

    一种会话处理方法和装置

    公开(公告)号:CN107317873B

    公开(公告)日:2020-08-11

    申请号:CN201710600145.9

    申请日:2017-07-21

    Abstract: 本发明公开了一种会话处理方法和装置,该会话处理方法包括:查询服务器的进程,从而确定进程的相关信息;根据相关信息,获取相关信息对应的日志信息;对日志信息进行解析,从而确定会话的连接情况。本发明通过查询服务器的进程,从而确定所述进程的相关信息,随后根据所述相关信息,获取所述相关信息对应的日志信息,最后对所述日志信息进行解析,从而确定所述会话的连接情况,从而能够实时显示会话的连接,以及实时统计客户机的连接情况,进而便于定位追踪。

    一种文件管理方法和装置
    74.
    发明公开

    公开(公告)号:CN106874358A

    公开(公告)日:2017-06-20

    申请号:CN201611238896.2

    申请日:2016-12-28

    CPC classification number: G06F17/301 G06F9/4482

    Abstract: 本发明提出了一种文件管理方法和装置,该文件管理方法包括:获取文件的操作信息,其中,操作信息包括第一文件节点的操作信息和/或第二文件节点的属性操作信息,并且根据全部的文件节点及其对应的属性信息,建立多叉树;根据操作信息,通过PYTHON脚本程序调用的API接口对第一文本节点进行操作;根据属性操作信息,通过多叉树对第二文件节点的属性进行操作。本发明利用PYTHON脚本程序调用的API接口和操作多叉树实现DEF文件的编写,从而操作都在本地完成,不需要上传到服务端,减少资源消耗,并且每次操作完后都会对DEF文件进行检验,保证DEF文件的正确性,此外,定位文件节点可通过映射表实现快速定位,避免了每次都遍历树的情况,从而加快了查询效率。

    一种基于PBS的电力应用封装方法

    公开(公告)号:CN102915252B

    公开(公告)日:2017-02-22

    申请号:CN201210348183.7

    申请日:2012-09-18

    Inventor: 张涛

    Abstract: 本发明提供一种基于PBS的电力应用封装方法,包括以下步骤:用户通过页面Portal选择潮流稳定计算的原始输入,并提交任务;后台自动处理输入文件并提交作业,且潮流任务参与调度;潮流计算成功,产生的BSE文件自动通过file-stage回传到自身作业的数据回收目录;稳定任务使用输入文件完成计算,开源作业调度系统通过file-stage将自身输出拷贝到自身的数据回收目录。本发明通过作业依赖、作业组、file-stage等机制,有效的提高电力应用的运行效率和集群的整体利用率。

    一种基于预约的批量作业调度方法

    公开(公告)号:CN102929695B

    公开(公告)日:2016-12-21

    申请号:CN201210348300.X

    申请日:2012-09-18

    Inventor: 张涛

    Abstract: 本发明提供一种基于预约的批量作业调度方法,包括以下步骤:提交作业并为作业指定耦合属性;作业调度系统对作业进行调度,若发现某个任务为耦合任务,则自动将这类任务作为一组,统一任务的优先级为该耦合任务中优先级最高的任务;若所有耦合任务成功创建临时预约,则开始作业启动过程;否则,删除之前创建的临时预约,然后继续处理下个作业;若所有耦合任务均对应临时预约,则批量启动所有耦合任务。本发明解决了耦合作业批量调度的问题,可以保证耦合任务的正常计算,同时还可以避免个别耦合任务启动但耦合作业整体不能计算的问题,提高集群的整体利用率。

    一种基于作业调度系统的应用作业控制系统及其控制方法

    公开(公告)号:CN102880506B

    公开(公告)日:2016-09-21

    申请号:CN201210333454.1

    申请日:2012-09-10

    Inventor: 张磊 张涛

    Abstract: 本发明涉及一种基于作业调度系统的应用作业控制系统及其控制方法,控制系统包括组播消息发送器、应用程序监控器和作业调度系统;当组播消息发送器被应用程序作业调用后,向组播域发送组播消息;应用程序监控器中的应用监听器接收所述组播消息并将其发送到应用程序监控器中的消息分析器中;消息分析器判定所述组播消息运行状态是否正常,若处于异常状态,则通过所述作业调度系统将该应用程序作业Rerun;该方法解决了现有调度系统仅从作业的角度为使用者提供作业的相应状态信息,而没有针对应用本身的运行状态进行监控和管理的问题,保证高性能计算集群上作业内的应用程序的正常运行,避免了资源的浪费,同时还保证了应用程序作业运行的准确性。

    一种基于进程扫描的非法作业监控方法

    公开(公告)号:CN102521101B

    公开(公告)日:2015-05-13

    申请号:CN201110405731.0

    申请日:2011-12-08

    Abstract: 本发明提供了一种基于进程扫描的非法作业监控方法,首先,初始化进程黑名单和白名单;其次,读取作业调度的作业详细信息;再次,获取所有计算节点的进程信息及网络连接信息;然后,根据步获取的信息,按照某种匹配策略判定进程与“黑名单”、“白名单”及作业的相关性,进而判定进程的合法性。最后,根据判定结果和预定的处理策略对非法进程作出后继处理,并更新进程的“未知”进程的状态计数;本发明的优点在于:综合作业信息和操作系统信息(进程+网络)来判定进程与作业的相关性,可以不用关心用户应用的并行编程模型;通过多种类型的白名单、黑名单以及后继处理策略均可灵活配置,极大简化了管理员的工作。

    一种基于网络拓扑结构的作业分配方法

    公开(公告)号:CN102904750A

    公开(公告)日:2013-01-30

    申请号:CN201210359410.6

    申请日:2012-09-24

    Inventor: 原帅 张涛

    Abstract: 本发明提供一种基于网络拓扑结构的作业分配方法,应用于计算机集群,选择节点的方法包括:步骤S1,选取一个节点,得到所述节点所属的交换机;步骤S2,根据所述节点所属交换机和拓扑关系,获得与所述节点所属交换机的拓扑距离小于等于TopologyChoosedDepth的所有交换机,判断所述所有交换机包含的所有节点的总数是否符合要求,是执行步骤S3,否,执行步骤S1;所述TopologyChoosedDepth为网络拓扑结构的调查深度;步骤S3,选取所述所有节点中权值最大的节点,结束。本发明提供一种基于网络拓扑结构的作业分配方法,根据服务器所处网络位置,将同一作业的任务尽可能的调度至同一网络区域中,能够提升高“通信/计算”比率作业的运行效率,网络模型更为精确,适应性更好,执行效率提升更加明显。

Patent Agency Ranking