-
公开(公告)号:CN113642736A
公开(公告)日:2021-11-12
申请号:CN202110861852.X
申请日:2021-07-29
Applicant: 中国科学院计算技术研究所
IPC: G06N20/00
Abstract: 本发明公开了一种基于冷热分离的梯度聚合方法,包括以下步骤:对稀疏场景的训练数据进行随机采样以对稀疏模型进行预训练;统计该稀疏模型的预训练过程中参数的频率,并根据该频率的大小将该参数分类为热参数或冷参数;利用该稀疏场景的训练数据对该稀疏模型进行重新训练,各训练节点分别传输该重新训练过程中的热参数梯度和冷参数梯度;该热参数梯度在可编程交换机上进行聚合后发送至远程服务器进行同步,该冷参数梯度由该可编程交换机直接该发送至远程服务器上进行聚合及同步。
-
公开(公告)号:CN117455016A
公开(公告)日:2024-01-26
申请号:CN202311464826.9
申请日:2023-11-06
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种面向网内梯度聚合系统的慢节点调度方法及装置,方法包含:通过收集每一工作节点的第一块完成时间;将所述第一块完成时间作为输入,对工作节点的状态进行建模;基于建模结果,得到系统在最快的K个工作节点下的预期训练完成时间;确定满足预期训练完成时间最小的最优K值,生成调度模型,以依据所述调度模型对工作节点进行调度。该方法可以自动跟踪系统内慢节点的变化,减少工作节点的空闲时间。
-
公开(公告)号:CN116708318A
公开(公告)日:2023-09-05
申请号:CN202310483691.4
申请日:2023-04-28
Applicant: 中国科学院计算技术研究所
IPC: H04L47/41 , H04L67/141
Abstract: 本发明提出一种基于硬件可编程交换机的TCP连接聚合方法和系统,包括:客户端、硬件可编程交换机和服务端;当该客户端或该服务端作为发送端向该服务端或该客户端作为接收端发送数据包时,该发送端将该数据包通过TCP连接发送至该硬件可编程交换机;该硬件可编程交换机通过修改该数据包的包头,将该数据包从发送端到硬件可编程交换机的第一连接空间映射到硬件可编程交换机到接收端的第二连接空间;该硬件可编程交换机将包头修改后的数据包通过TCP连接发送给接收端。本发明在较少连接数量的同时确保基于硬件交换机的连接削减不会影响网络系统的全面传输性能,且服务器端与客户端间的通信仍然保持面向连接的高可靠性传输。
-
公开(公告)号:CN116980365A
公开(公告)日:2023-10-31
申请号:CN202310777107.6
申请日:2023-06-28
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提出一种基于可编程交换机的分布式图计算网内聚合方法和系统,包括:将图计算任务中各图节点计算任务对应划分给分布式图计算系统的计算终端;在该分布式图计算系统内可编程交换机维护一个数组,用于记载计算终端需要聚合的图节点ID作为当前待聚合ID;计算终端判断该当前待聚合ID是否为计算终端本地需要聚合的节点ID,若是则将其负责的当前待聚合ID上的消息发送到该可编程交换机;该可编程交换机收到来自各计算终端的当前待聚合ID上的信息,执行网内聚合操作,得到当前待聚合ID的聚合结果,将该聚合结果发送给与其对应的计算终端执行当前待聚合ID的图计算。
-
公开(公告)号:CN113642736B
公开(公告)日:2023-09-12
申请号:CN202110861852.X
申请日:2021-07-29
Applicant: 中国科学院计算技术研究所
IPC: G06N20/00
Abstract: 本发明公开了一种基于冷热分离的梯度聚合方法,包括以下步骤:对稀疏场景的训练数据进行随机采样以对稀疏模型进行预训练;统计该稀疏模型的预训练过程中参数的频率,并根据该频率的大小将该参数分类为热参数或冷参数;利用该稀疏场景的训练数据对该稀疏模型进行重新训练,各训练节点分别传输该重新训练过程中的热参数梯度和冷参数梯度;该热参数梯度在可编程交换机上进行聚合后发送至远程服务器进行同步,该冷参数梯度由该可编程交换机直接该发送至远程服务器上进行聚合及同步。
-
公开(公告)号:CN113709064B
公开(公告)日:2022-11-01
申请号:CN202110843449.4
申请日:2021-07-26
Applicant: 中国科学院计算技术研究所
IPC: H04L49/10 , H04L49/109
Abstract: 本发明公开了一种P4交换机,包括:判断逻辑模块,用于根据输入该P4交换机的数据包内的信息来决定将该数据包发送到浮点运算模块或者数据转发模块;浮点运算模块,用于对该逻辑判断模块发送来的该数据包完成浮点数运算并发送该数据转发模块;数据转发模块,用于将该判断逻辑模块或者该浮点运算模块发送来的该数据包输出该P4交换机。
-
公开(公告)号:CN113709064A
公开(公告)日:2021-11-26
申请号:CN202110843449.4
申请日:2021-07-26
Applicant: 中国科学院计算技术研究所
IPC: H04L12/931
Abstract: 本发明公开了一种P4交换机,包括:判断逻辑模块,用于根据输入该P4交换机的数据包内的信息来决定将该数据包发送到浮点运算模块或者数据转发模块;浮点运算模块,用于对该逻辑判断模块发送来的该数据包完成浮点数运算并发送该数据转发模块;数据转发模块,用于将该判断逻辑模块或者该浮点运算模块发送来的该数据包输出该P4交换机。
-
-
-
-
-
-