一种基于SLURM作业调度系统的预计费装置和方法

    公开(公告)号:CN111198755A

    公开(公告)日:2020-05-26

    申请号:CN201911338453.4

    申请日:2019-12-23

    Abstract: 本发明提供了一种基于SLURM作业调度系统的预计费装置和方法,该装置包括SLURM作业调度系统和账号机时记账系统,SLURM作业调度系统包括:前处理模块,用于获取和传递作业运行前的作业信息;后处理模块,用于获取和传递作业运行后的作业信息;账号机时记账系统包括:第一执行模块,用于接收作业的运行前的作业信息,并根据运行前的作业信息对作业进行机时预约;第二执行模块,用于接收作业的运行后的作业信息,并根据运行后的作业信息对作业进行机时扣除。通过将SLURM调度系统与GOLD机时记账系统集成,将作业使用机时从用户可用机时中预约,作业结束后扣除机时。本发明进一步将用户作业使用资源机时化,且实现用户账号的机时管理。

    软件自动化测试方法及系统

    公开(公告)号:CN109086201A

    公开(公告)日:2018-12-25

    申请号:CN201810775767.X

    申请日:2018-07-16

    Abstract: 本发明提供一种软件自动化测试方法及系统。所述方法包括:通过版本推送机制,发现软件新版本,自动更新测试环境;为测试工具准备测试所需要的测试数据和测试用例;启动自动化测试框架;通过根据测试用例的源码自动生成测试套件配置信息,执行测试用例,并对操作步骤和测试结果进行截图保存;使用双通道卷积神经网络模型将测试结果与预期结果进行比较,得出相似度结果;对所有的测试结果进行分析,对同类型的问题进行归类,生成测试报告。本发明能够基于深度学习实现软件的自动化测试,提高测试的效率以及测试结果的正确率。

    集群指标告警的实现方法及集群指标告警系统

    公开(公告)号:CN109062772A

    公开(公告)日:2018-12-21

    申请号:CN201810776204.2

    申请日:2018-07-16

    CPC classification number: G06F11/327 G06F15/161

    Abstract: 本发明提供一种集群指标告警的实现方法及集群指标告警系统。所述方法包括:加载资源类型信息、各资源类型下所有的节点信息以及各节点的指标信息,并加载告警数据;当检测到用户点击节点的操作时,显示所述节点的节点信息以及所述节点下指标的采集情况;当指标的采集情况表示指标产生告警时,在检测到用户点击该指标之后,展示告警页面,所述告警页面中显示指标产生告警的原因。本发明能够减少数据访问量,缩短查询时间,方便用户操作。

    一种会话处理方法和装置

    公开(公告)号:CN107317873A

    公开(公告)日:2017-11-03

    申请号:CN201710600145.9

    申请日:2017-07-21

    Abstract: 本发明公开了一种会话处理方法和装置,该会话处理方法包括:查询服务器的进程,从而确定进程的相关信息;根据相关信息,获取相关信息对应的日志信息;对日志信息进行解析,从而确定会话的连接情况。本发明通过查询服务器的进程,从而确定所述进程的相关信息,随后根据所述相关信息,获取所述相关信息对应的日志信息,最后对所述日志信息进行解析,从而确定所述会话的连接情况,从而能够实时显示会话的连接,以及实时统计客户机的连接情况,进而便于定位追踪。

    一种网络拓扑图的显示方法和装置

    公开(公告)号:CN106789286A

    公开(公告)日:2017-05-31

    申请号:CN201611237578.4

    申请日:2016-12-28

    Abstract: 本发明提出了一种网络拓扑图的显示方法和装置,该显示方法包括:获取客户端的第一数据请求和第二数据请求;根据客户端的第一数据请求,获取IB网络的拓扑数据,并且根据第二数据请求,对拓扑数据进行解析,以将拓扑数据分为节点数据和节点关系数据,以及将节点数据和节点关系数据发送至客户端;客户端根据节点数据,对拓扑节点进行环形排列,并且根据节点关系数据,对排列后的拓扑节点进行连线。本发明通过环形排列布局能够更直观的展现IB网络拓扑。

    一种节点确定方法、装置、电子设备及存储介质

    公开(公告)号:CN112115030B

    公开(公告)日:2023-12-19

    申请号:CN202011045368.1

    申请日:2020-09-28

    Abstract: 本申请提供一种节点确定方法、装置、电子设备及存储介质。该方法包括:获取预设时间段内计算集群中各个计算节点的系统日志数据,系统日志数据中包括节点标识和对应的计算节点发生错误的指标名称;根据节点标识统计每个计算节点对应的各指标名称对应的系统日志数据的数量;根据各计算节点中,指标名称对应的优先级以及指标名称对应的系统日志数据的数量确定计算集群中的消极节点。本申请实施例中,由于不同指标名称对计算节点的性能影响不同,因此通过统计各个指标名称对应的系统日志数据的数量,从而能够高效地确定集群中各个计算节点的性能,进而获得消极节点。

    超算中心管理方法及装置
    38.
    发明公开

    公开(公告)号:CN116737492A

    公开(公告)日:2023-09-12

    申请号:CN202310659711.9

    申请日:2023-06-06

    Abstract: 本申请涉及一种超算中心管理方法及装置。该方法包括:在通过超算中心的数字孪生三维模型动态展示超算中心真实运行场景的情况下,基于数字孪生三维模型获取超算中心的实时运行监控数据,并根据超算中心的实时运行监控数据,对超算中心中的超计算集群进行管理。该方法不需要到现场对超算中心中的超计算集群进行管理,可以采用远程操控的方式对超算中心中的超计算集群进行管理,能够极大程度上提高超计算集群的管理速度和效率,再者,该方法通过超算中心的数字孪生三维模型模拟超算中心的真实运行场景,来获取超算中心对应的实时运行监控数据,可以提高实时运行监控数据的精准度,进而基于实时运行监控数据为基准,能够对超计算集群进行精准管理。

    一种集群性能的评价方法、装置、设备及存储介质

    公开(公告)号:CN113438110B

    公开(公告)日:2023-02-28

    申请号:CN202110696929.2

    申请日:2021-06-23

    Abstract: 本发明实施例公开了一种集群性能的评价方法、装置、设备及存储介质,该方法包括:确定待评价集群中的各个集群子系统,并基于集群子系统中的第一异常信息和/或第一可用信息确定集群子系统的质量评分,基于集群子系统中的第二异常信息和/或第二可用信息确定集群子系统的可用性评分;基于质量评分和可用性评分确定集群的性能评价结果,基于性能评价结果对集群进行运维;通过获取待评价集群的质量和可用性两个维度的评分,并获取最终的性能评价结果,实现了对待评价集群性能的准确评价,可以便于实现对待评价集群性能异常的及时告警,便于对待评价集群进行有效运营与维护,可以提升运维效率。

    一种在MESOS集群中集成高性能的作业调度框架的方法和装置

    公开(公告)号:CN108170417B

    公开(公告)日:2022-02-11

    申请号:CN201711476493.6

    申请日:2017-12-29

    Abstract: 本发明公开了一种在MESOS集群中集成高性能的作业调度框架的方法和装置,该方法包括:获取作业调度框架的作业信息,其中,作业信息包括作业调度框架上的作业的资源占用信息;将作业信息和MESOS集群中的可用资源信息相匹配;以及在作业信息和MESOS集群中的可用资源信息匹配成功后,将作业的资源占用信息同步到MESOS集群中,从而更新MESOS集群中的可用资源信息。本发明通过上述技术方案,从而实现了在Mesos集群集成了Slurm/PBS等高性能的作业调度框架,使得高性能作业可以在Mesos集群中运行并同步资源占用情况到Mesos集群中,进一步实现了超融合调度框架,使得高性能作业和其他作业可以在同一集群中运行且互不影响。

Patent Agency Ranking