-
公开(公告)号:CN119892837A
公开(公告)日:2025-04-25
申请号:CN202510093597.7
申请日:2025-01-21
Applicant: 上海交通大学
IPC: H04L67/1004 , H04L67/1014
Abstract: 本发明提供了一种支持动态负载均衡的分布式锁管理方法和系统,包括:拿锁或放锁步骤与迁移步骤;令客户端访问共享数据时,发送锁请求给服务端;令服务端执行拿锁或放锁步骤;服务端收到锁请求的总频率超过预设阈值,执行迁移步骤。本发明利用可编程交换机在机架内网络中心的位置优势追踪每个锁管理者的访问频率,并据此进行锁动态迁移目标的选择,具有更高的准确度和实时性;与基于服务器的负载均衡机制相比,从迁移决策到迁移完成花费的时间降低50%,迁移目标决策的准确度提升至100%。
-
公开(公告)号:CN119720297A
公开(公告)日:2025-03-28
申请号:CN202411800631.1
申请日:2024-12-09
Applicant: 上海交通大学
Abstract: 本发明提供了一种软硬协同的操作系统隔离性增强方法和系统,包括:驱动安全加载流程、内存隔离配置流程、指令集隔离配置流程与隔离域切换流程;进入驱动安全加载流程之后,进入指令集隔离配置流程;进入指令集隔离配置流程后,进入内存隔离配置流程;进入内存隔离配置流程后,进入隔离域切换流程,结束。本发明高效减少了跨域调用的高昂成本,具体而言,单次跨域调用成本为175cpu cycles,相较于现有使用虚拟化方法实现的隔离方案,即LVD,降低了221cpu cycles,隔离成本降低55.8%。
-
公开(公告)号:CN114969753B
公开(公告)日:2025-03-25
申请号:CN202210523188.2
申请日:2022-05-13
Applicant: 上海交通大学
Abstract: 本发明提供了一种动态决定运行态的可加载系统模块实现方法及系统,包括:通过基于capability的访问控制实现内核向运行在内核态和用户态的系统模块提供统一的API;通过符号重定位技术,实现加载系统模块时动态决定其所调用的内核API采用内核态实现还是用户态实现;在内核中基于capability机制提供跨模块调用机制,采用共享内存页传递参数和返回值;通过提供预设接口,允许在跨模块调用的内核API中一次在多个连接上等待。本发明利用符号重定位技术、capability机制,提出了新的跨模块调用机制,最终实现了可加载系统模块在操作系统运行期可选地加载到内核态或用户态并进行相互通信的方法。
-
公开(公告)号:CN119250232A
公开(公告)日:2025-01-03
申请号:CN202411511877.7
申请日:2024-10-28
Applicant: 上海交通大学
IPC: G06N20/00
Abstract: 本发明提供了一种机器学习模型混合并行策略自动搜索的方法及系统,其中系统包括:算子间并行策略搜索模块:该模块首先查询算子间性能开销模型,然后根据当前阶段算子间的性能开销来进行策略搜索。其中,算子间性能开销模型计算相应的流水线阶段开销。算子内并行策略搜索模块:该模块采用缩点消边的动态规划算法进行数据并行与张量并行的策略搜索。它先查询算子内性能开销模型,再进行策略搜索。而算子内性能开销模型通过使用基于执行的方法进行计算开销预估,同时使用基于计算的方法进行通信开销预估。本发明的搜索算法相比已有工作的搜索算法,具有更低的理论时间复杂度,能够更快地得出搜索结果,并还能保证搜索得到的策略质量。
-
公开(公告)号:CN114756581B
公开(公告)日:2024-10-25
申请号:CN202210427799.7
申请日:2022-04-22
Applicant: 上海交通大学
IPC: G06F16/2453 , G06F16/242
Abstract: 本发明提供了一种模板化数据库查询计划的等价性验证方法及系统,包括:步骤S1:将两个预设符号化查询计划树结构分别转换为两个无界半环表达式;步骤S2:将两个无界半环表达式构成的等式转换为一阶逻辑表达式;步骤S3:将约束集合转换为一阶逻辑表达式;步骤S4:基于两个无界半环表达式构成的一阶逻辑表达式和约束集合转换的一阶逻辑表达式形成了待求解的表示两个查询计划等价的一阶逻辑表达式;将待求解的一阶逻辑表达式利用SMT求解器求解,从而得到两个查询计划是否等价的结果;所述约束集合是符号化查询计划树结构内部的符号约束或一对符号化查询计划树结构之间的符号约束的集合。
-
公开(公告)号:CN118502963A
公开(公告)日:2024-08-16
申请号:CN202410819759.6
申请日:2024-06-24
Applicant: 上海交通大学
Abstract: 本发明提供了一种基于硬件加速的内存操作卸载系统及方法,包括:运行实例管理模块用于管理线程与协程两种不同粒度的运行实例的生命周期;该模块会在用户程序出现内存操作时拦截并转发到优化系统中,重新设置当前实例的运行时状态,调度到其他非阻塞的实例运行。加速器驱动模块:用于向内核申请加速器设备及运行队列资源、设备/工作队列负载的实时监测与统计、向不同运行队列分发内存操作描述符。该模块会在收到运行实例管理模块消息通知后及时响应以完成用户所需的内存操作任务。本发明能够在节省CPU资源的同时,通过卸载内存操作至加速器提升系统整体运行性能且可适用于多种支持该类加速器的硬件平台。
-
公开(公告)号:CN118468990A
公开(公告)日:2024-08-09
申请号:CN202410689244.9
申请日:2024-05-30
Applicant: 上海交通大学
IPC: G06N3/0985 , G06N3/084 , G06N3/088 , G06N3/0499 , G06N3/045 , G06N5/04 , G06N5/046 , G06N3/048
Abstract: 本发明提供了一种基于近似规约的预测器联合训练方法及系统,涉及预测器训练技术领域,包括:修改原模型步骤:修改原模型的前馈层结构,在前馈层前嵌入预测器并进行权重初始化;可微步骤:通过二值化转换机制使嵌入预测器的模型结构整体可微;冻结参数步骤:冻结原模型所有参数,仅保留预测器参数可训;训练步骤:采集并清洗通用语料,在通用语料上训练模型,利用多元数据使预测器拟合模型的激活特征。本发明具有高效、安全、自动化等特点,非常适合用于训练模型稀疏性的预测模块。
-
公开(公告)号:CN113609494B
公开(公告)日:2024-08-06
申请号:CN202110913971.5
申请日:2021-08-10
Applicant: 上海交通大学
Abstract: 本发明提供了一种适用于高性能场景下可信计算的软硬件系统及架构方法,包括硬件部分和软件开发部分,硬件部分包括主机和设备,主机包括基于RISC‑V架构的中央处理器,设备包括控制核、计算核以及使用控制核和计算核的架构,控制核负责双向的数据传输,配置计算核运行模式和分配计算任务;设备硬件向主机提供安全配置、指令队列和发送通知;软件开发部分包括使用C语言构建的主机应用、飞地进程和设备驱动,利用中央处理器的硬件特性将主机应用运行在飞地进程上,飞地进程通过设备驱动向设备请求服务。本发明在兼顾安全性的前提下,保证系统整体的吞吐,在飞地进程使用设备的同时,也允许运行在普通环境中的进程调用设备服务。
-
公开(公告)号:CN118245262A
公开(公告)日:2024-06-25
申请号:CN202410334810.4
申请日:2024-03-22
Applicant: 上海交通大学
IPC: G06F11/07
Abstract: 本发明提供一种GPU错误恢复方法及系统,包括:步骤S1:在程序编译阶段,为每个生成的GPU核函数生成包装代码;步骤S2:在运行阶段,用户调用GPU核函数,如果GPU核函数正常执行,则将返回值正常返回,否则进入步骤S3;步骤S3:当检测到发生错误后,通过错误分类器查询错误的可恢复性,如果错误可恢复,则进入步骤S4,否则进入步骤S6;步骤S4:通过幂等性验证器查询当前GPU核函数的幂等性,根据幂等性决定是否重新执行GPU核函数;步骤S5:如果GPU核函数具有幂等性,则重新执行该GPU核函数,否则进入步骤S6;步骤S6:将截获的错误重新返回。本发明能够提高系统的容错能力,降低系统的错误恢复延迟。
-
公开(公告)号:CN117689025B
公开(公告)日:2024-06-14
申请号:CN202311676610.9
申请日:2023-12-07
Applicant: 上海交通大学
Abstract: 本发明提供了一种适用于消费级显卡的快速大模型推理服务方法和系统,包括:对预测器基线模型进行训练,获得神经元激活预测模型,预测神经元是否激活;将模型中的神经元分类为静态神经元和动态神经元,在离线时期分别分发给GPU和CPU;为每个神经元定义一个影响因子,并建立一个整数线性规划模型,通过近似求解获得执行效率最大化的神经元分发策略,并依据该策略将神经元预载到对应存储器中;CPU和GPU按照依赖关系异步执行各自神经元上已激活神经元的运算,最后同步合并运算结果;根据神经元激活预测的结果,识别并跳过未激活神经元的计算。本发明兼顾模型推理的运算速率和准确率,在提升推理服务性能的同时维持模型本身的准确率。
-
-
-
-
-
-
-
-
-