-
公开(公告)号:CN116776939A
公开(公告)日:2023-09-19
申请号:CN202310765012.2
申请日:2023-06-27
Applicant: 北京邮电大学深圳研究院
IPC: G06N3/0495 , G06N3/045 , G06N3/0442 , G06N3/063
Abstract: 本发明涉及人工智能和移动计算技术领域,且公开了一种面向终端设备的稀疏化大语言模型的部署方法,在Switch Transformer网络结构的基础上通过概率统计和并行化技术进行的改进,Switch Transformer网络结构中将T5模型中的FFN层替换为MoE结构,设计一个全局的专家暂存器,专家暂存器管理从磁盘中加载的专家网络,在进行推理时会直接使用专家暂存器中的专家网络进行推理,实现了在终端设备上以少量推理时间的增加为代价,部署远大于终端设备内存上限的模型,并实现零精度损失的推理部署。
-
公开(公告)号:CN114866476A
公开(公告)日:2022-08-05
申请号:CN202210376871.8
申请日:2022-04-12
Applicant: 北京邮电大学深圳研究院
Abstract: 本发明涉及网络传输技术领域,且公开了一种无损高效的RDMA传送方法,所述传送方法包括RDMA数据包重传和RDMA智能流控机制,所述RDMA智能流控机制包括有链路状态反馈机制和流量控制机制;所述RDMA数据包重传包括以下步骤:S1、发送节点维护发送窗口,记录当前待发送及已发送为收到确认的数据包编号;S2、依窗口记录的编号顺序依次向接受方发送数据包;S3、接受方收到数据后,构建确认数据包。该无损高效的RDMA传送方法,通过研究在广域分布式网络环境下,将网络拓扑、流量特征、机器学习的传输特征实现有机的整合,提出一种无损高效的RDMA传送技术,通过精细化拥塞控制与流控制策略来最大化带宽利用率解决数据处理效率低和传输时延过长问题。
-
公开(公告)号:CN118612894A
公开(公告)日:2024-09-06
申请号:CN202410747321.1
申请日:2024-06-11
Applicant: 北京邮电大学深圳研究院 , 北京邮电大学
Abstract: 本申请提供了一种星载5G核心网实现方法和系统,星载5G核心网的网元包括S‑AMF、S‑SMF和S‑UPF;S‑AMF接收到第一星上基站发送的N2消息时,向S‑SMF发送第一PDU会话更新请求;S‑SMF向S‑AMF返回第一PDU会话更新响应;S‑AMF向第二星上基站发送切换请求;并接收第二星上基站返回的切换响应;若S‑AMF确定接收到的切换响应为允许切换时,向S‑SMF发送第二PDU会话更新请求;S‑SMF向S‑AMF返回第二PDU会话更新响应;并与S‑UPF交互进行N4会话修改,获取上下行链路信息。该方法能够将卫星通信和5G网络在系统层面进行深度融合,真正实现星载5G核心网络。
-
公开(公告)号:CN114866476B
公开(公告)日:2023-06-30
申请号:CN202210376871.8
申请日:2022-04-12
Applicant: 北京邮电大学深圳研究院
Abstract: 本发明涉及网络传输技术领域,且公开了一种无损高效的RDMA传送方法,所述传送方法包括RDMA数据包重传和RDMA智能流控机制,所述RDMA智能流控机制包括有链路状态反馈机制和流量控制机制;所述RDMA数据包重传包括以下步骤:S1、发送节点维护发送窗口,记录当前待发送及已发送为收到确认的数据包编号;S2、依窗口记录的编号顺序依次向接收方发送数据包;S3、接收方收到数据后,构建确认数据包。该无损高效的RDMA传送方法,通过研究在广域分布式网络环境下,将网络拓扑、流量特征、机器学习的传输特征实现有机的整合,提出一种无损高效的RDMA传送技术,通过精细化拥塞控制与流控制策略来最大化带宽利用率解决数据处理效率低和传输时延过长问题。
-
-
-