一种在多方之间执行加密矩阵乘法的方法及装置

    公开(公告)号:CN119960725A

    公开(公告)日:2025-05-09

    申请号:CN202411834143.2

    申请日:2024-12-12

    Inventor: 洪澄 李萌

    Abstract: 本说明书实施例提供了一种在多方之间执行加密矩阵乘法的方法及装置。其中,第一方拥有的第一矩阵和第二方拥有的第一向量中的元素为子多项式,子多项式是通过对若干数值元素编码得到的。第一方将第一矩阵包含的多个子多项式分成若干组,使得任意的第一组中的子多项式之间满足:在矩阵乘法中不存在相加关系,并且分别与第一向量中的子多项式之间存在对应的相乘关系。接着,第一方将第一组的多个子多项式编码为第一大多项式。同时,第二方将第一向量包含的若干子多项式编码为第二大多项式。第一方和第二方之间,通过基于安全多方计算的数据交互,执行第一大多项式与第二大多项式之间的乘法,得到第一子结果。

    一种混合专家模型推理方法
    8.
    发明公开

    公开(公告)号:CN118863055A

    公开(公告)日:2024-10-29

    申请号:CN202410826116.4

    申请日:2024-06-25

    Applicant: 北京大学

    Abstract: 本发明公开一种混合专家模型推理方法,属于深度学习(machine learning)领域。本发明通过自适应和基于敏感度的专家门控机制,动态调整不同输入和每一层所需激活的专家数量,具有基于敏感度分析的自适应专家选取、自适应专家预取与自适应专家缓存三个核心机制,可以优化混合专家模型推理性能。本发明在保持精度不下降的前提下,平均减少了25%的专家激活数量,显著提高了MoE推理的效率,特别适用于边缘设备等内存受限的环境,具有重要的应用价值和广泛的应用前景。

    一种卷积神经网络层级流水加速器生成方法和装置

    公开(公告)号:CN117952164A

    公开(公告)日:2024-04-30

    申请号:CN202410005986.5

    申请日:2024-01-02

    Applicant: 北京大学

    Inventor: 王源 郭晴宇 李萌

    Abstract: 本发明提供一种卷积神经网络层级流水加速器生成方法和装置,通过对神经网络的权重进行重参数化,将所有定点数操作转化为整数操作,以方便数据在硬件上的实现和存储;构建3比特乘法器作为卷积神经网路的量化精度;构建拼接刷新的数据流机制作为数据访问策略,减少数据预取通路上的资源消耗;基于预设的约束条件以及神经网络中的结构尺寸和数据范围通过设计空间探索算法来获取最佳的设计点;最后将上述的数据访问策略、重参数化后的权重、最佳的设计点和3比特乘法器填入预设的硬件代码模板,构建实现方案,将实现方案转化为比特流文件;最后将比特流文件写入逻辑芯片,构建神经网络加速器,实现在加速器在硬件效率和模型准确率之间的良好权衡。

Patent Agency Ranking