面向海量数据实时处理的云边协同自适应深度推理方法

    公开(公告)号:CN115392467B

    公开(公告)日:2024-02-09

    申请号:CN202211040427.5

    申请日:2022-08-29

    Abstract: 本发明提供了一种面向海量数据实时处理的云边协同自适应深度推理方法。该方法包括:将DNN模型进行模型量化,根据得到的量化模型对DNN模型进行DAG构建;对DAG网络进行可行分割点的搜索,得到优化后的潜在分割点集;基于优化后的潜在分割点集对DNN模型各层在终端设备上运行的累积推理延迟、数据传输延迟和累积量化损失进行数据拟合,利用以带宽为变量的权重函数对DNN模型各层的累积推理延迟、数据传输延迟和累积量化损失的目标函数进行加权优化,得到最优的分割点;根据所述最优分割点将DNN模型进行分割。本发明考虑到模型量化带来的精度损失,将精度损失和时延根据网络质量的变化进行加权优化,以满足用户在不同的网络质量下对服务质量的不同需求。

    一种基于分布式存储的铁路BIM模型文件的传输方法

    公开(公告)号:CN120091017A

    公开(公告)日:2025-06-03

    申请号:CN202411949646.4

    申请日:2024-12-27

    Abstract: 本发明提供了一种基于分布式存储的铁路建筑信息模型BIM模型文件的传输方法。该方法包括:将铁路BIM模型文件进行轻量化分解得到多个子文件,云服务器将各个子文件分布式存储在各个边缘服务器节点,向网关传输子文件列表,构建BIMdex索引模型,利用训练数据集对BIMdex索引模型进行训练,将训练好的BIMdex索引模型部署到网关本地,当端设备向网关发出携带文件标识的文件请求时,网关中的BIMdex索引模型根据文件标识查询子文件列表,获取对应的BIMdex地址索引并返回给端设备。本发明方法通过将铁路BIM文件数据同一模型的子文件分散存储在多个物理节点,结合负载均衡技术,以显著提升数据传输效率。

    面向海量数据实时处理的云边协同自适应深度推理方法

    公开(公告)号:CN115392467A

    公开(公告)日:2022-11-25

    申请号:CN202211040427.5

    申请日:2022-08-29

    Abstract: 本发明提供了一种面向海量数据实时处理的云边协同自适应深度推理方法。该方法包括:将DNN模型进行模型量化,根据得到的量化模型对DNN模型进行DAG构建;对DAG网络进行可行分割点的搜索,得到优化后的潜在分割点集;基于优化后的潜在分割点集对DNN模型各层在终端设备上运行的累积推理延迟、数据传输延迟和累积量化损失进行数据拟合,利用以带宽为变量的权重函数对DNN模型各层的累积推理延迟、数据传输延迟和累积量化损失的目标函数进行加权优化,得到最优的分割点;根据所述最优分割点将DNN模型进行分割。本发明考虑到模型量化带来的精度损失,将精度损失和时延根据网络质量的变化进行加权优化,以满足用户在不同的网络质量下对服务质量的不同需求。

Patent Agency Ranking