一种深度学习模型计算图拆分方法及编译系统

    公开(公告)号:CN118963996A

    公开(公告)日:2024-11-15

    申请号:CN202410950770.6

    申请日:2024-07-16

    Applicant: 东北大学

    Abstract: 本发明提供一种深度学习模型计算图拆分方法及编译系统,涉及计算机科学技术领域。该方法首先通过获取深度学习模型计算图,采用遗传算法设计性能评估器,获得深度学习模型计算图各个分支在不同核上的推理性能,自适应的将深度学习模型计算图各个分支映射到最佳核,并划分为子图。然后通过编译系统,将子图编译成序列化文件,实现了多分支在多核上的部署。该发明提出的深度学习模型计算图划分方法及编译系统充分评估了子图在多核加速器上的实际推理能力并能支持多样的深度模型架构,从而显著提高推理性能,使得边缘智能应用获得更快的响应速度和更高的处理效率,解决了可扩展性差的问题。

    一种支持FPGA加速器的ROS2调度系统

    公开(公告)号:CN118838693A

    公开(公告)日:2024-10-25

    申请号:CN202410920416.9

    申请日:2024-07-10

    Applicant: 东北大学

    Abstract: 本发明公开一种支持FPGA加速器的ROS2调度系统,涉及计算机技术领域。该系统包括注册模块、调度模块、加速器管理模块和运行时监控模块;注册模块进行回调的注册和共享内存的分配;调度模块为加速器核分配容器并进行回调优先级配置;加速器管理模块用于本地任务队列管理和加速器调用;运行时监控模块监控回调的运行状态,回收已运行完成的ROS2节点和回调所分配的共享内存。建立ROS2执行器中回调处理链优先级、回调优先级与加速器优先级的相互关联,避免加速器无法感知ROS2回调处理链优先级和回调优先级的难题,保证了关键回调处理链的回调能够及时访问到加速器资源并执行,最大化提高了集成FPGA加速器的机器人平台的处理性能,实现了机器人感知任务的实时计算。

    一种多核实时任务调度分析与仿真系统及方法

    公开(公告)号:CN114327829A

    公开(公告)日:2022-04-12

    申请号:CN202111650333.5

    申请日:2021-12-30

    Abstract: 本发明提供一种多核实时任务调度分析与仿真系统及方法,属于计算机实时操作系统技术领域,所述系统包括任务建模模块、可调度性分析模块、调度仿真模块、性能分析模块;通过扩展经典的有向无环图DAG模型,在条件有向无环图Conditional DAG模型中加入了If和Join结点,从而可以描述因程序中的if‑then‑else分支控制结构导致的动态负载变化情况。本发明开发的多核仿真工具支持经典DAG模型和Conditional DAG模型的任务调度仿真与性能分析,从而可以极大地方便工程技术人员或研究人员设计、建模、验证、分析面向多核嵌入式系统的并行实时任务。

Patent Agency Ranking