-
公开(公告)号:CN114118368A
公开(公告)日:2022-03-01
申请号:CN202111388309.9
申请日:2021-11-22
Applicant: 上海交通大学
Abstract: 一种基于Shamir安全多方计算的隐私保护多方强化学习系统及方法,包括:基于shamir的安全定点数计算模块、基于定点数计算实现的安全梯度下降模块、基于安全梯度下降实现的服务器mix网络模块、智能体网络模块和智能体‑服务器通信模块,本发明使用Shamir的秘密分享方案形成服务器间的安全随机梯度下降算法的协议,获得了更灵活的部署能力,并且能够容忍一些掉线。本发明根据安全协议的要求修改Q‑mix模型的网络,确保其对半诚实对手的安全性。