面向大规模GPU集群的分布式训练时间预测方法及装置

    公开(公告)号:CN116258199B

    公开(公告)日:2023-10-10

    申请号:CN202211610735.7

    申请日:2022-12-14

    Applicant: 浙江大学

    Abstract: 本发明公开了面向大规模GPU集群的分布式训练时间预测方法及装置,方案为:基于GPU的硬件特征和神经网络模型的结构特征建立多层感知器模型,逐层预测分布式训练的计算时间;利用回归分析方法对GPU集群中单链路的通信吞吐量与通信数据量之间的关系进行建模;通过分析通信拓扑和分布式训练算法的执行原理得到集群通信模型,进而预测GPU集群的通信时间;根据计算与通信的并行关系提取出分布式训练的关键路径,基于关键路径得到分布式训练时间。本发明用于在分布式训练任务实际部署到大规模GPU集群之前预测其训练时间,从而指导业界研究人员合理分配GPU资源,避免时间和资源的浪费,同时对分布式训练性能优化也具有指导意义。

    面向大规模GPU集群的分布式训练时间预测方法及装置

    公开(公告)号:CN116258199A

    公开(公告)日:2023-06-13

    申请号:CN202211610735.7

    申请日:2022-12-14

    Applicant: 浙江大学

    Abstract: 本发明公开了面向大规模GPU集群的分布式训练时间预测方法及装置,方案为:基于GPU的硬件特征和神经网络模型的结构特征建立多层感知器模型,逐层预测分布式训练的计算时间;利用回归分析方法对GPU集群中单链路的通信吞吐量与通信数据量之间的关系进行建模;通过分析通信拓扑和分布式训练算法的执行原理得到集群通信模型,进而预测GPU集群的通信时间;根据计算与通信的并行关系提取出分布式训练的关键路径,基于关键路径得到分布式训练时间。本发明用于在分布式训练任务实际部署到大规模GPU集群之前预测其训练时间,从而指导业界研究人员合理分配GPU资源,避免时间和资源的浪费,同时对分布式训练性能优化也具有指导意义。

    一种面向光刻热点检测的模型分块聚合隐私保护方法

    公开(公告)号:CN116756764A

    公开(公告)日:2023-09-15

    申请号:CN202310489532.5

    申请日:2023-05-04

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向光刻热点检测的模型分块聚合隐私保护方法,每个客户端节点利用本地光刻热点数据集训练局部模型参数,再对参数按特征分块并分别发送给多个中心服务器进行参数聚合,最后中心服务器将聚合完毕的全局模型参数再返回给各客户端节点,并由客户端节点在本地进行模型参数块拼接以进行下一轮迭代。本发明保护了基于联邦学习的光刻热点检测系统中各客户端的本地模型更新参数,解决了更新参数隐私泄露问题,成功防御了对本地光刻热点图像数据的重构攻击,并提高了中心服务器端模型参数聚合和通信速度。

    基于联邦个性化学习的光刻热区检测方法

    公开(公告)号:CN113222031B

    公开(公告)日:2022-04-12

    申请号:CN202110545686.2

    申请日:2021-05-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于联邦个性化学习的光刻热区检测方法,中心服务器聚合每个节点返回的全局模型参数,用于融合每个节点的共同特征,更新全局模型参数,再把最新的全局模型参数反馈到每个节点;每个节点从中心服务器下载全局模型参数,然后利用本地数据训练局部模型参数,以找到当前全局模型参数下局部模型参数的最优,用于克服不同节点的模型异构和数据异构;局部模型参数微调之后,节点利用本地数据训练全部参数,以找到当前参数的最优,用于寻找不同节点的共同特征。本发明解决了局部数据过少而产生的模型过拟合问题;保护各芯片设计厂商之间的数据,实现隐私保护;提高了异构环境中联邦个性化学习模型的稳定性和整体精度。

    基于联邦个性化学习的光刻热区检测方法

    公开(公告)号:CN113222031A

    公开(公告)日:2021-08-06

    申请号:CN202110545686.2

    申请日:2021-05-19

    Applicant: 浙江大学

    Abstract: 本发明公开了一种基于联邦个性化学习的光刻热区检测方法,中心服务器聚合每个节点返回的全局模型参数,用于融合每个节点的共同特征,更新全局模型参数,再把最新的全局模型参数反馈到每个节点;每个节点从中心服务器下载全局模型参数,然后利用本地数据训练局部模型参数,以找到当前全局模型参数下局部模型参数的最优,用于克服不同节点的模型异构和数据异构;局部模型参数微调之后,节点利用本地数据训练全部参数,以找到当前参数的最优,用于寻找不同节点的共同特征。本发明解决了局部数据过少而产生的模型过拟合问题;保护各芯片设计厂商之间的数据,实现隐私保护;提高了异构环境中联邦个性化学习模型的稳定性和整体精度。

    一种异构无人集群编队避障方法及系统

    公开(公告)号:CN115033016A

    公开(公告)日:2022-09-09

    申请号:CN202210539701.7

    申请日:2022-05-17

    Applicant: 浙江大学

    Abstract: 本发明公开了一种异构无人集群编队避障方法及系统。该方法中根据异构无人集群编队避障系统确定领航者和跟随者,采用领航者可切换的方式,在集群中找到最合适的智能体作为领航者;根据异构无人集群编队避障系统的运动状态以及环境中障碍物的位置构造分布式的编队避障控制器;根据异构无人集群编队避障系统的运动状态以及控制输入构造运动学约束模块保证智能体的控制输入限制在相应智能体的运动学约束范围之内;根据异构无人集群编队避障系统的通信拓扑关系构造通信拓扑模块;根据异构无人集群编队避障系统中智能体的异构性构造空地协同模块;本发明实现存在障碍物条件下的编队和避障之间的权衡控制。

    一种面向物料识别的神经网络推理加速方法

    公开(公告)号:CN113222148B

    公开(公告)日:2022-01-11

    申请号:CN202110549464.8

    申请日:2021-05-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向物料识别的神经网络推理加速方法,解决了边缘端网络推理延迟严重的问题。首先,本发明创造性的运用余弦距离来判定量化前后的网络特征分布差异,从而确定不同层对量化到低比特的敏感性;运用混合精度量化将网络中对量化敏感的层量化到更高的比特。其次,针对物料识别网络划分方法受网络带宽影响较大的问题,本发明在传统的模型划分算法中加入正则化项,优先选取更低比特量化层作为划分点,降低推理受网络带宽的影响。最后,本发明面向混合精度量化和网络划分协同设计中,混合精度和划分点选取搜索空间大的问题,基于贪婪算法先根据网络精度要求确定混合精度量化方案,再选取总延时最少的划分点。

    一种面向光刻热点检测的模型分块聚合隐私保护方法

    公开(公告)号:CN116756764B

    公开(公告)日:2024-06-04

    申请号:CN202310489532.5

    申请日:2023-05-04

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向光刻热点检测的模型分块聚合隐私保护方法,每个客户端节点利用本地光刻热点数据集训练局部模型参数,再对参数按特征分块并分别发送给多个中心服务器进行参数聚合,最后中心服务器将聚合完毕的全局模型参数再返回给各客户端节点,并由客户端节点在本地进行模型参数块拼接以进行下一轮迭代。本发明保护了基于联邦学习的光刻热点检测系统中各客户端的本地模型更新参数,解决了更新参数隐私泄露问题,成功防御了对本地光刻热点图像数据的重构攻击,并提高了中心服务器端模型参数聚合和通信速度。

    一种异构无人集群编队避障方法及系统

    公开(公告)号:CN115033016B

    公开(公告)日:2023-03-17

    申请号:CN202210539701.7

    申请日:2022-05-17

    Applicant: 浙江大学

    Abstract: 本发明公开了一种异构无人集群编队避障方法及系统。该方法中根据异构无人集群编队避障系统确定领航者和跟随者,采用领航者可切换的方式,在集群中找到最合适的智能体作为领航者;根据异构无人集群编队避障系统的运动状态以及环境中障碍物的位置构造分布式的编队避障控制器;根据异构无人集群编队避障系统的运动状态以及控制输入构造运动学约束模块保证智能体的控制输入限制在相应智能体的运动学约束范围之内;根据异构无人集群编队避障系统的通信拓扑关系构造通信拓扑模块;根据异构无人集群编队避障系统中智能体的异构性构造空地协同模块;本发明实现存在障碍物条件下的编队和避障之间的权衡控制。

    一种面向物料识别的神经网络推理加速方法

    公开(公告)号:CN113222148A

    公开(公告)日:2021-08-06

    申请号:CN202110549464.8

    申请日:2021-05-20

    Applicant: 浙江大学

    Abstract: 本发明公开了一种面向物料识别的神经网络推理加速方法,解决了边缘端网络推理延迟严重的问题。首先,本发明创造性的运用余弦距离来判定量化前后的网络特征分布差异,从而确定不同层对量化到低比特的敏感性;运用混合精度量化将网络中对量化敏感的层量化到更高的比特。其次,针对物料识别网络划分方法受网络带宽影响较大的问题,本发明在传统的模型划分算法中加入正则化项,优先选取更低比特量化层作为划分点,降低推理受网络带宽的影响。最后,本发明面向混合精度量化和网络划分协同设计中,混合精度和划分点选取搜索空间大的问题,基于贪婪算法先根据网络精度要求确定混合精度量化方案,再选取总延时最少的划分点。

Patent Agency Ranking