基于分布式内存管理的大模型训练故障恢复方法和装置

    公开(公告)号:CN119473732A

    公开(公告)日:2025-02-18

    申请号:CN202510067262.8

    申请日:2025-01-16

    Abstract: 本发明公开一种基于分布式内存管理的大模型训练故障恢复方法,当判断当前训练轮次需要进行检查点保存业务,获取当前时刻模型状态,并将获取到的模型状态序列化成可存储的格式,生成检查点数据;然后将检查点数据从节点内设备端内存传输至主机端内存;并在传输完毕后继续训练任务,同时进行异步检查点保存;异步检查点保存包括数据分布式内存备份和数据持久化到磁盘两种;训练任务出错时,通过检查点数据进行任务恢复。本发明故障恢复时优先从内存中读取备份数据,可以显著减少因磁盘I/O瓶颈导致的延迟,从而减少因保存或加载检查点数据操作而导致的训练暂停或效率下降,保持GPU或其他计算资源的高效利用,提高大规模模型训练的连续性和稳定性。

    一种基于向量化指令集的虚拟GPU的实现方法

    公开(公告)号:CN119201361A

    公开(公告)日:2024-12-27

    申请号:CN202411700119.X

    申请日:2024-11-26

    Abstract: 本发明公开了一种基于向量化指令集的虚拟GPU的实现方法,用于在CPU处理器中构建虚拟GPU加速卡,使能处理器平台上的虚拟异构加速计算。本方法包括:以CPU中可伸缩向量指令为基础构建虚拟GPU线程运行环境,其中向量化计算单元中的每一个标量计算单元作为虚拟GPU的一个并行计算核,每一个虚拟GPU并行核拥有独立栈空间作为本地存储空间;由虚拟GPU任务管理器创建虚拟GPU线程所需的任务块空间并管理虚拟GPU任务的运行。本系统通过利用CPU可伸缩向量指令的并行化执行能力,构建了类GPU并行化计算模式,以此构建虚拟GPU,提供了在没有GPU硬件的环境下的GPU使用。

    一种基于时空信息的跨毫米波雷达目标跟踪方法

    公开(公告)号:CN113567951B

    公开(公告)日:2022-01-18

    申请号:CN202111126119.X

    申请日:2021-09-26

    Abstract: 本发明提出一种基于时空信息的跨毫米波雷达目标跟踪方法,通过引入时空信息对目标轨迹进行匹配拼接,借助于动态时间规整避免了时间因素对轨迹相似度计算的影响,极大提高了拼接算法的精度,将时间维度信息应用于单雷达中断航迹的接续,实现了单设备内雷达目标轨迹的拼接。同时在拼接过程中,采用基于动态时间规整与PCA‑KL散度的相似度算法完成匹配,从轨迹特性和概率分布两个维度对跨设备目标进行轨迹拼接,极大提高了跨毫米波雷达轨迹拼接的效果。

    一种面向5G新空口的网络切片内资源分配方法

    公开(公告)号:CN113746677A

    公开(公告)日:2021-12-03

    申请号:CN202111021001.0

    申请日:2021-09-01

    Abstract: 本发明提供一种面向5G新空口的网络切片内资源分配方法,充分考虑5G新空口频域资源结构特征,并针对5G网络中业务差异性、多样性的特性,设计基于业务数据流量、信息时效性等服务需求指标的业务资源分配优先级。同时,在5G网络硬切片的基础上,提供一种多用户终端、多数据包流共存情况下的基于资源分配优先级设计的网络切片内资源分配方法。该方法首先满足各用户终端的最低传输速率要求,然后以最大化切片内加权传输速率之和作为优化目标进行资源分配。本发明提供的方法具有低复杂度的特点,能够实现切片内资源灵活、快速、动态调整分配,并且能够显著提高资源利用率、提升用户终端服务体验。

    一种基于V2X辅助的车辆高精度定位方法、装置和存储介质

    公开(公告)号:CN116931005A

    公开(公告)日:2023-10-24

    申请号:CN202311208648.3

    申请日:2023-09-19

    Abstract: 本发明公开了一种基于V2X辅助的车辆高精度定位方法、装置和存储介质,包括以下步骤:S1:判断智能网联车的全球导航卫星系统工作状态是否有效;S2:智能网联车接收路侧单元广播信息并进行身份校验;S3:路侧单元根据智能网联车感知硬件信息,广播对应高精地图的唯一识别编码和下载地址;S4:智能网联车下载本地未检索到的高精地图;S5:智能网联车通过地图匹配定位算法获取当前位置;S6:通过航迹推算实现智能网联车定位信息实时高频更新。本发明通过V2X技术辅助智能网联车在全球导航卫星系统失效状态下保持高精度定位,结合通过V2X技术获取的周边实时交通信息,可以有效提高车辆自主驾驶、导航、调度等应用的准确性和可靠性,具有广泛的应用前景。

Patent Agency Ranking