多核平台下串行程序运行时的自动并行化加速方法

    公开(公告)号:CN101916185A

    公开(公告)日:2010-12-15

    申请号:CN201010264074.8

    申请日:2010-08-27

    Abstract: 一种计算机技术领域的多核平台下串行程序运行时的自动并行化加速方法,新增可共享读取的程序计数器寄存器组,并在操作系统中建立自动并行加速线程,选择一个线程作为加速的对象,然后实时地分析此线程将要执行到的指令代码,并对其中执行循环的指令代码进行修改,达到使被加速线程自动并行执行的目的。本发明在运行时对程序进行自动并行,不用对现有程序进行预先的处理,整个过程由操作系统完成,对于用户完全透明。本发明能够在有空闲的CPU核时自动利用空闲资源对程序进行并行加速,免去等待预先处理程序的时间,也省去用户手动转换程序的麻烦。

    自动化识别的视频监控方法

    公开(公告)号:CN101281676B

    公开(公告)日:2010-12-01

    申请号:CN200810038175.6

    申请日:2008-05-29

    Abstract: 一种自动化识别的视频监控方法,步骤为:首先建立参考标签阵列,调整射频阅读器的功率确保其读取范围能够全面地覆盖标签阵列;接着,计算参考标签阵列中每个电子标签信号强度的均值,和每个标签在物体经过时的信号强度变化范围,统计分析得出信号强度阈值;然后,记录所有标签包括参考标签在整个监控过程中的信号强度,并通过补充丢失项和去除异常值形成信号强度序列;再转化信号强度序列成轨迹集合,并从轨迹集合中产生频繁轨迹集合;最后,通过检测过程来判断目前的行为是不是系统许可的活动。本发明不仅提供了与现有技术相似的准确率,更提供了实时监控的功能,节省人力资源成本和视频实时识别技术的成本。

    基于替代服务模型的实时网格事务管理系统

    公开(公告)号:CN101661403A

    公开(公告)日:2010-03-03

    申请号:CN200910195773.9

    申请日:2009-09-17

    Abstract: 本发明是一种计算机技术领域的基于替代服务模型的实时网格事务管理系统,包括:实时事务应用模块、实时事务服务模块、实时事务执行模块和服务注册中心,其中:实时事务应用模块向实时事务服务模块发出事务处理请求,实时事务服务模块负责协调和管理实时事务执行模块,实时事务执行模块负责执行事务,服务注册中心为实时事务服务模块提供实时事务执行模块的信息。本发明通过将完成相同功能的网格服务作为一个替代服务组来建立替代模型,使完成相同功能的网格服务被重启的可能性减小,从而降低在高度动态、极端异构、地理分布的网格环境中的实时事务失败的概率,提高实时事务在截止期内成功提交的几率。

    蓝牙设备自动分类组网的方法

    公开(公告)号:CN101415255A

    公开(公告)日:2009-04-22

    申请号:CN200810203433.1

    申请日:2008-11-27

    CPC classification number: Y02D70/10 Y02D70/42

    Abstract: 本发明涉及的是一种无线通信技术领域的蓝牙设备自动分类组网的方法。步骤为:依据蓝牙设备的分类标准对蓝牙设备进行分类;蓝牙设备在通信范围内连接,然后获取对方的属性信息进行验证,如果是同类蓝牙设备,继续连接,否则断开连接,这样在通信范围内的同类蓝牙设备连接起来,将同类蓝牙设备组成若干个孤立的散射网,确定每个孤立散射网中的超级结点,用来标识该散射网;每个孤立的散射网向外发送探测消息,选择与要组网的蓝牙设备不同类的蓝牙设备作为桥接点,将区域的散射网连接起来,形成全局的散射网。本发明不仅能保证连通性的情况下,散射网数量最少,还能够提高平均传输速度,减少整个散射网的能量消耗等。

    基于离群值分离激活值混合量化的神经网络优化方法

    公开(公告)号:CN119761429A

    公开(公告)日:2025-04-04

    申请号:CN202411911735.X

    申请日:2024-12-24

    Abstract: 一种基于离群值分离激活值混合量化的神经网络优化方法,采用Z‑Score方式将预处理后的激活值分解为离群值和正常值后,分别对正常值使用采用4bit分组量化、对于离群值采用8bit量化并保存到显存中,在反向传播计算到该层时对保存的量化后离群值和正常值进行恢复处理实现优化。本发明能够减小前向传播后保存在显存中的激活值大小,保证模型可以训练的同时,显著减小所有层前向传播之后保存的总激活值大小,相比其他技术,能够提供更高吞吐率,并且能够尽可能减小量化误差。

    面向动态性特征的微服务应用优化资源管理系统及方法

    公开(公告)号:CN119203047A

    公开(公告)日:2024-12-27

    申请号:CN202310754097.4

    申请日:2023-06-25

    Abstract: 一种面向动态性特征的微服务应用优化资源管理系统及方法,包括:基于网络的负载监控器、感知阻塞的负载更新器和资源高效的请求清空器,当微服务应用出现负载和调用图动态性时,负载监控器根据每个微服务的网络监控数据,解析得到网络流量和网络包,通过机器学习中的线性回归技术预测得到监控负载;负载更新器根据监控负载和通过微服务间的调用关系和调用顺序构建的阻塞图,计算每个微服务的真实待处理负载,并为其分配相应资源量;请求清空器根据负载更新器输出的每个微服务的真实负载及当前资源分配信息,计算在剩余QoS恢复时间内每个微服务的过量负载,并为每个微服务分配过量资源,实现快速恢复应用的QoS目标。本发明在无需对于微服务应用进行代码修改的情况下,既可在微服务应用动态性下快速恢复应用的QoS目标,又可以最小化资源分配量以保持资源效率,可以为云数据中心中微服务应用发生负载和调用图动态性时的优化资源管理技术落地提供支持。

    图神经网络模型的编译优化方法、编译器及存储介质

    公开(公告)号:CN119149040A

    公开(公告)日:2024-12-17

    申请号:CN202310713862.8

    申请日:2023-06-15

    Abstract: 本发明提供一种图神经网络模型的编译优化方法、编译器及存储介质,所述图神经网络模型的编译优化方法包括:包括:获取输入的图神经网络模型,通过配置计算图重写规则和张量的图级语义对所述图神经网络模型的第一层级中间表示进行优化;对所述第一层级的优化输出进行计算图切分;基于切分的计算图和图感知嵌套循环体对所述图神经网络模型的第二层级中间表示进行优化。本发明能够大幅度提升GNN模型的计算性能,为基于GNN模型的广泛应用提供高性能的计算支持。

    一种参数粒度自适应调频的联邦学习方法及系统

    公开(公告)号:CN118607618A

    公开(公告)日:2024-09-06

    申请号:CN202410782352.0

    申请日:2024-06-18

    Abstract: 本发明提供参数粒度自适应调频的联邦学习方法及系统,包括:服务器选择每轮参与训练的客户端,将每个参数同步频率的更新信息传输到被选择的客户端;客户端的模型训练进程从通讯守护进程接收聚合的参数,根据每个参数的同步频率进行同步训练;通讯守护进程接收完成训练的参数,与服务器通讯进行聚合,再从服务器接收聚合后的参数并在下一轮训练时返回给模型训练进程;在聚合时,服务端计算梯度冲突率,当某个参数的梯度冲突率小于阈值时,将该参数的同步频率增倍,在下一轮训练时传输需要更新频率的参数的位置到所有的客户端中。本发明采用参数粒度的调频方式,对每个参数进行更准确的频率设置,保证训练效率的同时,提高最终模型的收敛准确率。

    条带合并方法、系统及可读存储介质

    公开(公告)号:CN118349171A

    公开(公告)日:2024-07-16

    申请号:CN202410427750.0

    申请日:2024-04-10

    Abstract: 本发明涉及存储技术领域,尤其涉及一种条带合并方法、系统及可读存储介质,方法包括:将合并前条带的编码矩阵的每一行看作一个分块,构造具有分块对称特征的合并后条带的编码矩阵;基于所述合并后条带的编码矩阵,利用陪集分解理论来构造柯西矩阵生成集中的X和Y,得到柯西编码矩阵;利用所述柯西编码矩阵对条带进行合并,计算得到所述合并后条带的校验块。通过将合并前条带的编码矩阵的每一行看作一个分块,那么合并后条带的编码矩阵则是以合并前条带的编码矩阵的分块构成的一个分块对称矩阵,在这种特征下,条带合并时计算新校验块的过程就可以复用合并前条带的旧校验块,进而减少计算开销。然后再基于所述合并后条带的编码矩阵,使用陪集分解理论来构造柯西矩阵生成集中的X和Y,使得到的柯西编码矩阵在满足柯西矩阵性质的同时具有分块对称的特征,以便于实现窄条带纠删码的友好合并。

    基于深度神经网络模型的数据保护方法、系统及介质

    公开(公告)号:CN117171766B

    公开(公告)日:2024-04-05

    申请号:CN202310955526.4

    申请日:2023-07-31

    Abstract: 本发明提供一种基于深度神经网络模型的数据保护方法、系统及介质,其中,所述方法包括:获取初始深度神经网络模型,其中,所述初始深度神经网络模型包括多个分割子图;基于所述分割子图利用距离正则化机制筛选掉不满足安全距离的分支,以得到全安全子图的目标深度神经网络模型;在输入数据基于所述目标深度神经网络模型处理过程中,利用位置加密对中间处理数据进行加密作业。本发明提出了一种基于深度神经网络模型的数据保护方法,旨在解决现有技术中完全加密的私有推理的延迟问题以及部分加密的私有推理的安全泄露问题,具体通过安全子图约束和位置加密的方法在防止安全泄露的前提下大大减少了延迟,达到良好的性能效果。

Patent Agency Ranking