一种基于动态电压频率调整的能源效率优化方法

    公开(公告)号:CN118868077B

    公开(公告)日:2025-02-18

    申请号:CN202411095327.1

    申请日:2024-08-12

    Inventor: 侯帅 王强 施少怀

    Abstract: 本发明公开了一种基于动态电压频率调整的能源效率优化方法,包括:在大型语言模型的离线状态下,对不同负载大小的数据进行能耗测试,得到不同动态电压频率调整配置下的能耗表现;根据得到的不同动态电压频率调整配置下的能耗表现,确定各个批量在预填充阶段和解码阶段的最佳动态电压频率调整配置;根据确定的最佳动态电压频率调整配置调整图形处理器内核频率和内存频率,以对大型语言模型推理的能源效率进行优化;本发明提出了一种基于动态电压频率调节(DVFS)的优化方案,针对大模型推理的预填充阶段和解码阶段,分别应用不同的动态电压频率调整配置以实现能耗优化。

    一种空间转录组基因表达预测方法、系统及终端

    公开(公告)号:CN119943145A

    公开(公告)日:2025-05-06

    申请号:CN202411787192.5

    申请日:2024-12-06

    Abstract: 本发明公开了一种空间转录组基因表达预测方法、系统及终端,所述方法包括:对基因表达预测模型进行训练,得到目标基因表达预测模型;获取待预测的目标组织学图像,对目标组织学图像进行预处理,得到预处理后图像,按照捕获位点的坐标将所述预处理后图像分割成多个子图像块,将多个子图像块分别输入到目标基因表达预测模型中进行特征提取,得到每个子图像块各自对应的目标图像特征,根据多个目标图像特征进行基因表达预测,得到目标基因表达结果。本发明将预测任务看作是不同模态数据之间的相互学习:建立模型学习两种特征之间潜在关联,最后使用预测模块通过一种特征预测出另一种模态的特征,能够高精度的完成基因表达预测任务。

    一种多用户GPU集群的深度学习任务调度方法

    公开(公告)号:CN118093208A

    公开(公告)日:2024-05-28

    申请号:CN202410510424.6

    申请日:2024-04-26

    Abstract: 本发明公开了一种多用户GPU集群的深度学习任务调度方法,包括:构建深度学习任务对象,并将对应的深度学习任务发射到集群中;获取每个已发射任务的状态,并根据调度器的信号或任务本身状态的变化修改对应的任务状态;获取所述集群中的资源状态,并根据所述集群的反馈信息确定每个已发射任务对应的资源占用情况;根据每个已发射任务对应的资源占用情况和任务状态,利用短任务优先的资源共享策略对待分配任务进行资源分配;本发明依靠短任务优先的资源共享策略,在缓解任务资源饥饿问题的同时,降低了整体的任务完成时间,提高了深度学习任务的调度效率。

    一种基于动态电压频率调整的能源效率优化方法

    公开(公告)号:CN118868077A

    公开(公告)日:2024-10-29

    申请号:CN202411095327.1

    申请日:2024-08-12

    Inventor: 侯帅 王强 施少怀

    Abstract: 本发明公开了一种基于动态电压频率调整的能源效率优化方法,包括:在大型语言模型的离线状态下,对不同负载大小的数据进行能耗测试,得到不同动态电压频率调整配置下的能耗表现;根据得到的不同动态电压频率调整配置下的能耗表现,确定各个批量在预填充阶段和解码阶段的最佳动态电压频率调整配置;根据确定的最佳动态电压频率调整配置调整图形处理器内核频率和内存频率,以对大型语言模型推理的能源效率进行优化;本发明提出了一种基于动态电压频率调节(DVFS)的优化方案,针对大模型推理的预填充阶段和解码阶段,分别应用不同的动态电压频率调整配置以实现能耗优化。

    一种多用户GPU集群的深度学习任务调度方法

    公开(公告)号:CN118093208B

    公开(公告)日:2024-07-26

    申请号:CN202410510424.6

    申请日:2024-04-26

    Abstract: 本发明公开了一种多用户GPU集群的深度学习任务调度方法,包括:构建深度学习任务对象,并将对应的深度学习任务发射到集群中;获取每个已发射任务的状态,并根据调度器的信号或任务本身状态的变化修改对应的任务状态;获取所述集群中的资源状态,并根据所述集群的反馈信息确定每个已发射任务对应的资源占用情况;根据每个已发射任务对应的资源占用情况和任务状态,利用短任务优先的资源共享策略对待分配任务进行资源分配;本发明依靠短任务优先的资源共享策略,在缓解任务资源饥饿问题的同时,降低了整体的任务完成时间,提高了深度学习任务的调度效率。

Patent Agency Ranking