图数据处理方法、设备及存储介质

    公开(公告)号:CN118296199A

    公开(公告)日:2024-07-05

    申请号:CN202410384094.0

    申请日:2024-03-29

    Abstract: 本公开实施例提供一种图数据处理方法、设备及存储介质,在图形处理器中获取针对图结构的查询请求,以请求在图结构中基于指定的起始节点查询子图结构,并对查询请求依次生成采样任务;在图形处理器的任一线程块中调用图形处理器中的计算引擎选择与采样任务的任务量匹配的目标采样器执行采样任务,以在采样任务指定的起始节点基础上选择下一目标邻居节点,并作为新的起始节点生成新采样任务;根据依次选择的目标邻居节点形成子图结构作为查询请求的查询结果。本公开将图形处理器线程块的线程组织成不同的采样器,动态随机游走的查询请求的采样任务根据任务量选择目标采样器,实现资源动态分配,提高图形处理器执行动态随机游走的负载均衡和并发度。

    自主设备优化架构生成方法
    2.
    发明公开

    公开(公告)号:CN118760522A

    公开(公告)日:2024-10-11

    申请号:CN202410863781.0

    申请日:2024-06-29

    Abstract: 一种自主设备优化架构生成方法,根据优化指标、推理负载、架构约束和数据流策略进行能量收集建模和自主推理建模,从而刻画AuT供电系统和AuT推理系统的功能和行为;根据建立后的模型进行架构时序仿真,得到满足指定SWaP限制的自主边缘平台架构候选方案;再在其基础上进行基于软硬件配置优化的双层架构优化搜索,得到优化后的自主计算架构方案。本发明能够自动地为不同边缘人工智能应用场景生成一个定制的自主设备方案,包括自主供电系统和智能推理芯片,以提升边缘计算自主性;适用于任何自主设备的场景。

    基于原数据的SMG实现系统及方法

    公开(公告)号:CN117493043B

    公开(公告)日:2024-06-18

    申请号:CN202311482405.9

    申请日:2023-11-09

    Abstract: 一种基于原数据的SMG实现系统及方法,包括:设置于DSP输入端的原始数据缓存区、数据缓存区创建和控制模块、DSP控制处理模块、多模态选择模块和自适应多模态计算模块,原始数据缓存区临时存储来自传感器的原始模态数据,多模态选择模块通过神经网络判断原始模态数据中模态数据的重要度后,将重要的模态数据输出至DSP进行处理,数据缓存区创建和控制模块为应用实现创建、读、写数据缓存区,DSP控制处理模块提供系统调用,自适应多模态计算模块通过构建并训练神经网络后,在线根据输入的模态进行自适应的模态融合计算并给出计算结果。本发明通过预先进行多模态门控处理,对进入DSP的模态数据进行提前筛选,以保证不需要的模态数据不经过DSP,从而避免DSP造成不必要的能量和执行时间浪费。

    多请求并发的GPU图随机游走优化实现方法及系统

    公开(公告)号:CN116188239B

    公开(公告)日:2023-09-12

    申请号:CN202211536501.2

    申请日:2022-12-02

    Abstract: 一种多请求并发的GPU图随机游走优化实现方法及系统,在离线阶段对图随机游走请求分类并正对各个请求的GPU资源占用情况,建立基于图随机游走请求类型和资源占用情况的并发效果判断机制;在在线阶段通过调度器预测图随机游走请求执行时间并根据各个图随机游走请求的适合度调整运行优先级和/或运行组合,通过GPU内存存储层级及多加速器端进行图数据切分管理和图随机游走请求执行。本发明能够实现低干扰、低延迟的图数据切分管理及低停顿的图随机游走请求执行,充分挖掘多GPU空分共享同时处理多并发请求的性能潜力,提高GPU上运行图随机游走请求的整体吞吐率,并降低能耗。

    多请求并发的GPU图随机游走优化实现方法及系统

    公开(公告)号:CN116188239A

    公开(公告)日:2023-05-30

    申请号:CN202211536501.2

    申请日:2022-12-02

    Abstract: 一种多请求并发的GPU图随机游走优化实现方法及系统,在离线阶段对图随机游走请求分类并正对各个请求的GPU资源占用情况,建立基于图随机游走请求类型和资源占用情况的并发效果判断机制;在在线阶段通过调度器预测图随机游走请求执行时间并根据各个图随机游走请求的适合度调整运行优先级和/或运行组合,通过GPU内存存储层级及多加速器端进行图数据切分管理和图随机游走请求执行。本发明能够实现低干扰、低延迟的图数据切分管理及低停顿的图随机游走请求执行,充分挖掘多GPU空分共享同时处理多并发请求的性能潜力,提高GPU上运行图随机游走请求的整体吞吐率,并降低能耗。

    基于DVFS自动跨层的终端功耗管理系统及方法

    公开(公告)号:CN118747517A

    公开(公告)日:2024-10-08

    申请号:CN202410741258.0

    申请日:2024-06-11

    Abstract: 一种基于DVFS自动跨层的终端功耗管理系统及方法,包括:CPM引擎和CPM控制器,其中:CPM引擎搜索当前运行的DNN模型的最优的DVFS配置,CPM控制器控制DNN模型在AIoT系统中的实时运行过程。本发明通过对DVFS开销进行建模,使用合并网络层和自动编解码等技术对搜索空间进行优化,从而获得在考虑DVFS开销的情况下的最优的DVFS配置,以控制DNN模型运行时的动态功耗,本发明能够显著降低DNN模型计算的能耗,提高计算效率,对促进DNN模型的应用部署和落地以及智慧物联的发展具有较为重要的意义。

    基于原数据的SMG实现系统及方法
    7.
    发明公开

    公开(公告)号:CN117493043A

    公开(公告)日:2024-02-02

    申请号:CN202311482405.9

    申请日:2023-11-09

    Abstract: 一种基于原数据的SMG实现系统及方法,包括:设置于DSP输入端的原始数据缓存区、数据缓存区创建和控制模块、DSP控制处理模块、多模态选择模块和自适应多模态计算模块,原始数据缓存区临时存储来自传感器的原始模态数据,多模态选择模块通过神经网络判断原始模态数据中模态数据的重要度后,将重要的模态数据输出至DSP进行处理,数据缓存区创建和控制模块为应用实现创建、读、写数据缓存区,DSP控制处理模块提供系统调用,自适应多模态计算模块通过构建并训练神经网络后,在线根据输入的模态进行自适应的模态融合计算并给出计算结果。本发明通过预先进行多模态门控处理,对进入DSP的模态数据进行提前筛选,以保证不需要的模态数据不经过DSP,从而避免DSP造成不必要的能量和执行时间浪费。

Patent Agency Ranking