-
公开(公告)号:CN116258199B
公开(公告)日:2023-10-10
申请号:CN202211610735.7
申请日:2022-12-14
Applicant: 浙江大学
IPC: G06N3/098 , G06N3/0464 , G06F15/163
Abstract: 本发明公开了面向大规模GPU集群的分布式训练时间预测方法及装置,方案为:基于GPU的硬件特征和神经网络模型的结构特征建立多层感知器模型,逐层预测分布式训练的计算时间;利用回归分析方法对GPU集群中单链路的通信吞吐量与通信数据量之间的关系进行建模;通过分析通信拓扑和分布式训练算法的执行原理得到集群通信模型,进而预测GPU集群的通信时间;根据计算与通信的并行关系提取出分布式训练的关键路径,基于关键路径得到分布式训练时间。本发明用于在分布式训练任务实际部署到大规模GPU集群之前预测其训练时间,从而指导业界研究人员合理分配GPU资源,避免时间和资源的浪费,同时对分布式训练性能优化也具有指导意义。
-
公开(公告)号:CN116258199A
公开(公告)日:2023-06-13
申请号:CN202211610735.7
申请日:2022-12-14
Applicant: 浙江大学
IPC: G06N3/098 , G06N3/0464 , G06F15/163
Abstract: 本发明公开了面向大规模GPU集群的分布式训练时间预测方法及装置,方案为:基于GPU的硬件特征和神经网络模型的结构特征建立多层感知器模型,逐层预测分布式训练的计算时间;利用回归分析方法对GPU集群中单链路的通信吞吐量与通信数据量之间的关系进行建模;通过分析通信拓扑和分布式训练算法的执行原理得到集群通信模型,进而预测GPU集群的通信时间;根据计算与通信的并行关系提取出分布式训练的关键路径,基于关键路径得到分布式训练时间。本发明用于在分布式训练任务实际部署到大规模GPU集群之前预测其训练时间,从而指导业界研究人员合理分配GPU资源,避免时间和资源的浪费,同时对分布式训练性能优化也具有指导意义。
-
公开(公告)号:CN113861485B
公开(公告)日:2022-11-29
申请号:CN202111171774.7
申请日:2021-10-08
Applicant: 浙江大学
IPC: C08J7/18 , C08L75/04 , C08L77/00 , C08L27/06 , C08L33/26 , C08L33/24 , C08L43/02 , C08L35/02 , C08L33/14 , A61L31/10 , A61L31/14
Abstract: 本发明公开了一种与高分子材料表面形成互穿网络结构的亲水润滑涂层及其制备方法。制备方法包括步骤:(1)将高分子材料浸入含有光引发剂的有机溶液中,使光引发剂通过溶胀、扩散作用进入到高分子材料的表面以下,接着将高分子材料转移到清洗溶剂中洗去高分子材料表面外侧附着的光引发剂,然后取出高分子材料用惰性气体吹干,得到含有光引发剂的高分子材料,其中光引发剂被截留在高分子材料表面以下;(2)将步骤(1)得到的含有光引发剂的高分子材料置于单体溶液中并在紫外光照下引发单体原位聚合,聚合完成后取出高分子材料,清洗得到与高分子材料表面形成互穿网络结构的亲水润滑涂层。
-
公开(公告)号:CN113861485A
公开(公告)日:2021-12-31
申请号:CN202111171774.7
申请日:2021-10-08
Applicant: 浙江大学
IPC: C08J7/18 , C08L75/04 , C08L77/00 , C08L27/06 , C08L33/26 , C08L33/24 , C08L43/02 , C08L35/02 , C08L33/14 , A61L31/10 , A61L31/14
Abstract: 本发明公开了一种与高分子材料表面形成互穿网络结构的亲水润滑涂层及其制备方法。制备方法包括步骤:(1)将高分子材料浸入含有光引发剂的有机溶液中,使光引发剂通过溶胀、扩散作用进入到高分子材料的表面以下,接着将高分子材料转移到清洗溶剂中洗去高分子材料表面外侧附着的光引发剂,然后取出高分子材料用惰性气体吹干,得到含有光引发剂的高分子材料,其中光引发剂被截留在高分子材料表面以下;(2)将步骤(1)得到的含有光引发剂的高分子材料置于单体溶液中并在紫外光照下引发单体原位聚合,聚合完成后取出高分子材料,清洗得到与高分子材料表面形成互穿网络结构的亲水润滑涂层。
-
公开(公告)号:CN1544883A
公开(公告)日:2004-11-10
申请号:CN200310108856.2
申请日:2003-11-25
Applicant: 浙江大学
Abstract: 本发明公开了一种基于特定网格图案的三维脚型测量和建模的方法。它用印有网格的袜子穿在人的脚上,然后通过多个数码相机或者摄像机同时拍摄,确保每个网格的角点(corner)被至少两个数码相机或者摄像机拍到,然后基于立体视觉和光学成像的原理,恢复出所有网格角点的三维位置;在此基础上,利用这些恢复出的角点的三维位置,重新拟合出覆盖在人脚上的三维网格,最后根据三维网格对标准脚的空间位置约束,通过变形建模方法,建立特定的三维脚型的模型,并计算出脚型的参数。本发明硬件成本低,并把硬件装置和软件系统有机地结合在一起,既避免了单一的硬件实现的高成本,也避免了单一的软件实现的低精度。本发明可操作性强,而且实现成本低,利于推广使用。
-
公开(公告)号:CN119788688A
公开(公告)日:2025-04-08
申请号:CN202411689019.1
申请日:2024-11-25
Applicant: 浙江大学
IPC: H04L67/1095 , H04L67/1042 , G06N3/08
Abstract: 本发明公开了一种基于AllReduce架构的高效参数同步方法,该方法首先根据底层物理链路带宽对节点进行分组分解,使分解后的链路带宽与通信量相匹配,再根据分解后不同通信阶段的通信量对待通信数据进行分块,最后每个数据块在不同类型链路上以分组分解AllReduce的方式并行地进行参数同步。本发明用于在复杂网络环境下进行高效的参数同步,能克服带宽异构的影响,在多网卡场景下可以高效地并行,单网卡场景下也能利用空闲链路提高并行度,在同构和异构网络环境下都能取得优异的性能表现。
-
公开(公告)号:CN100348949C
公开(公告)日:2007-11-14
申请号:CN200310108856.2
申请日:2003-11-25
Applicant: 浙江大学
Abstract: 本发明公开了一种基于特定网格图案的三维脚型测量和建模的方法。它用印有网格的袜子穿在入的脚上,然后通过多个数码相机或者摄像机同时拍摄,确保每个网格的角点(corner)被至少两个数码相机或者摄像机拍到,然后基于立体视觉和光学成像的原理,恢复出所有网格角点的三维位置;在此基础上,利用这些恢复出的角点的三维位置,重新拟合出覆盖在人脚上的三维网格,最后根据三维网格对标准脚的空间位置约束,通过变形建模方法,建立特定的三维脚型的模型,并计算出脚型的参数。本发明硬件成本低,并把硬件装置和软件系统有机地结合一起,即避免了单一的硬件实现的高成本,也避免了单一的软件实现的低精度,本发明可操作性强,而且实现成本低,利于推广使用。
-
公开(公告)号:CN116756764A
公开(公告)日:2023-09-15
申请号:CN202310489532.5
申请日:2023-05-04
Applicant: 浙江大学
IPC: G06F21/62 , G06N20/00 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种面向光刻热点检测的模型分块聚合隐私保护方法,每个客户端节点利用本地光刻热点数据集训练局部模型参数,再对参数按特征分块并分别发送给多个中心服务器进行参数聚合,最后中心服务器将聚合完毕的全局模型参数再返回给各客户端节点,并由客户端节点在本地进行模型参数块拼接以进行下一轮迭代。本发明保护了基于联邦学习的光刻热点检测系统中各客户端的本地模型更新参数,解决了更新参数隐私泄露问题,成功防御了对本地光刻热点图像数据的重构攻击,并提高了中心服务器端模型参数聚合和通信速度。
-
公开(公告)号:CN113222031B
公开(公告)日:2022-04-12
申请号:CN202110545686.2
申请日:2021-05-19
Applicant: 浙江大学
Abstract: 本发明公开了一种基于联邦个性化学习的光刻热区检测方法,中心服务器聚合每个节点返回的全局模型参数,用于融合每个节点的共同特征,更新全局模型参数,再把最新的全局模型参数反馈到每个节点;每个节点从中心服务器下载全局模型参数,然后利用本地数据训练局部模型参数,以找到当前全局模型参数下局部模型参数的最优,用于克服不同节点的模型异构和数据异构;局部模型参数微调之后,节点利用本地数据训练全部参数,以找到当前参数的最优,用于寻找不同节点的共同特征。本发明解决了局部数据过少而产生的模型过拟合问题;保护各芯片设计厂商之间的数据,实现隐私保护;提高了异构环境中联邦个性化学习模型的稳定性和整体精度。
-
公开(公告)号:CN113222031A
公开(公告)日:2021-08-06
申请号:CN202110545686.2
申请日:2021-05-19
Applicant: 浙江大学
Abstract: 本发明公开了一种基于联邦个性化学习的光刻热区检测方法,中心服务器聚合每个节点返回的全局模型参数,用于融合每个节点的共同特征,更新全局模型参数,再把最新的全局模型参数反馈到每个节点;每个节点从中心服务器下载全局模型参数,然后利用本地数据训练局部模型参数,以找到当前全局模型参数下局部模型参数的最优,用于克服不同节点的模型异构和数据异构;局部模型参数微调之后,节点利用本地数据训练全部参数,以找到当前参数的最优,用于寻找不同节点的共同特征。本发明解决了局部数据过少而产生的模型过拟合问题;保护各芯片设计厂商之间的数据,实现隐私保护;提高了异构环境中联邦个性化学习模型的稳定性和整体精度。
-
-
-
-
-
-
-
-
-