一种无模型的GPU在线能效优化方法及系统

    公开(公告)号:CN117891677A

    公开(公告)日:2024-04-16

    申请号:CN202310843318.5

    申请日:2023-07-10

    Abstract: 一种无模型的GPU在线能效优化方法及系统,属于计算机能效优化技术,为了实现GPU在线自动能效优化而提出。技术要点:性能基准在线测量,在默认频率配置下全面收集GPU kernel活动信息,设计覆盖度指标,评估收集信息的完备度;应用性能在线评估,在某种特定频率配置下收集GPU kernel活动信息,通过比较此时的GPU kernel活动信息与默认配置下的对应GPU kernel活动信息,设计复合性能指标,来在线评估当前频率配置下的相对性能;基于PID的频率调节算法,使用经典的离散PID控制器,将性能损失设为控制目标,在性能损失约束范围内,尝试降低频率以优化性能;控制稳定判定算法,通过最近几次控制的结果判断PID控制稳定性,若稳定则暂停控制以减小开销;应用负载变化检测算法,测量低开销GPU运行特征向量,设计算法比较特征向量之间的距离,以检测应用负载变化,若发生负载变化则重启PID控制。降低GPU能耗,提高GPU能效,减少碳排放。

    一种基于图结构的多源迁移学习方法

    公开(公告)号:CN112085085B

    公开(公告)日:2024-02-23

    申请号:CN202010917529.5

    申请日:2020-09-03

    Abstract: 一种基于图结构的多源迁移学习方法,属于人工智能领域,为了解决单纯利用图结构数据的节点实体特征不能准确预测目标域节点标签的问题。该方法通过构建节点T‑邻域结构,获得T‑邻域结构集合;并对T‑邻域结构集合进行去重,获得子图集B;通过学习子图集B,获得通用结构;利用通用结构分别获得源域节点结构特征和目标域节点结构特征;将节点实体特征和节点结构特征相结合,分别获得源域新特征和目标域新特征,从而获得目标域节点标签。本发明方法可以应用于目标任务相同的同构迁移学习和异构迁移学习,在具有图结构的数据中具有很好的预测效果,可以对一个新未知网络进行较为准确的节点标签信息预测。

    一种无服务计算中加速启动方法及系统

    公开(公告)号:CN113703867B

    公开(公告)日:2024-01-30

    申请号:CN202110985231.2

    申请日:2021-08-26

    Abstract: 一种无服务计算中加速启动方法及系统,涉及无服务计算技术领域,用以解决现有无服务计算中由于冷启动的存在而导致任务执行的响应时间过长的问题。本发明的技术要点包括:构建两层容器:用户容器和任务容器,每个用户容器对应一个用户设备,对于每个任务请求,容器启动的过程包括查找该任务请求对应的用户容器,如果没有查找到则创建对应的用户容器;创建成功或查找到则将该任务请求转发至用户容器;在用户容器中启动任务容器处理任务请求。本发明中用户容器负责隔离,任务容器负责执行任务,任务容器经过裁剪具有很低的启动延迟;利用过去调用规律预测未来启动来减少冷启动次数,进一步降低启动延迟,相比现有冷启动回收机制具有大幅度提升。

    一种未访问源数据的多源异构网络迁移方法

    公开(公告)号:CN117236419A

    公开(公告)日:2023-12-15

    申请号:CN202311176935.0

    申请日:2023-09-13

    Abstract: 本发明公开了一种未访问源数据的多源异构网络迁移方法,涉及迁移学习技术领域,以解决异构网络上的相关问题。本发明的技术要点包括:首先使用基于伯恩斯坦多项式的深度网络嵌入模块在异构网络进行预训练得到一组源模型;得到一组训练好的源模型之后,不再使用源数据,利用域适应模块对得到的一组源模型进行域适应,使用训练得到的最优权重加权聚合域适应后的源模型得到最优目标模型。在域适应过程不访问源数据的前提下,本发明方法可以自动地将通过嵌入模块训练得到一组源模型与合适的权重组合在一起,使其性能至少与最佳源模型一样好,并最小化了负迁移的影响。

    一种基于深度强化学习的GPU动态能源效率优化运行时方法及系统

    公开(公告)号:CN116909378A

    公开(公告)日:2023-10-20

    申请号:CN202310747721.8

    申请日:2023-06-25

    Abstract: 本发明公开了一种基于深度强化学习的GPU动态能源效率优化运行时方法及系统,涉及效率优化技术领域。本发明的技术要点包括:将GPU中应用程序工作负载的环境状态当作优先经验回放的双深度Q网络的状态,将GPU功率配置当作优先经验回放的双深度Q网络的动作,训练基于优先经验存储双深度Q网络的GPU动态能源效率优化模型;双深度Q网络的当前Q网络用于选择最优的GPU频率配置,目标Q网络用于评估选择的最优GPU频率配置对能源效率的影响;从训练得到的效率优化模型中为当前状态选择最佳的GPU功率封顶配置调整能耗。本发明使得动态调整的功率配置能够在不显著影响程序执行时间的情况下降低GPU的能耗,实现了动态自动的GPU处理器的能源效率优化。

    一种基于屏蔽自注意力网络的话题感知信息转发预测方法及系统

    公开(公告)号:CN116842398A

    公开(公告)日:2023-10-03

    申请号:CN202310765614.8

    申请日:2023-06-27

    Abstract: 本发明公开了一种基于屏蔽自注意力网络的话题感知信息转发预测方法及系统,涉及信息转发预测技术领域。本发明的技术要点包括:提取消息中的话题表示,将话题表示与用户嵌入进行融合表示,获得用户‑话题依赖表示;构建包含上下文编码器、掩码生成器、掩码编码器的屏蔽自注意力网络,将用户‑话题依赖表示输入屏蔽自注意力网络,获得上下文用户依赖感知的用户表示;利用注意力机制计算目标用户与历史感染用户列表的相似度,以对用户表示进行优化重建;通过计算对应优化重建后用户表示的级联表示与下一个用户之间的似然关系来获取下一个用户的激活概率。本发明可为舆情研判、个性化推荐、热点话题识别等应用提供有价值的决策辅助支撑。

    一种CUDA线程放置优化方法
    159.
    发明授权

    公开(公告)号:CN110399182B

    公开(公告)日:2023-05-12

    申请号:CN201910680644.2

    申请日:2019-07-25

    Abstract: 一种CUDA线程放置优化方法,涉及基于机器学习的线程优化技术。本发明的目的是提供一种CUDA线程放置优化方法,以实现降低编程人员工作难度以及减少训练数据的获取时间的目的。技术要点:程序信息采集、程序信息处理、机器学习模型训练,程序信息处理是对静态信息和程序运行时信息进行信息汇总、数值化处理、归一化处理得到训练集程序特征,并利用程序执行时间信息集设置标签从而完成标签数据的生成;将训练集程序特征和标签数据作为输入,利用支持向量机算法进行性能建模,得到程序性能预测模型;在线程优化放置应用时,首先需调用程序信息采集模块,采集待优化程序的程序信息,然后输入已训练好的程序性能预测模型,即可获得合适的线程块设置方案。

    一种基于二进制引力搜索的节能虚拟机放置方法

    公开(公告)号:CN111045785B

    公开(公告)日:2023-04-07

    申请号:CN201911169998.7

    申请日:2019-11-25

    Abstract: 一种基于二进制引力搜索的节能虚拟机放置方法,属于节能优化的云计算领域。本发明的目的是为了实现在虚拟机放置降低能耗,同时提高云计算性能。技术要点:初始化;随机设置每个智能体的位置,确保位置在搜索空间中即可;在每次迭代中,我们计算初始位置的所有智能体的适应度,如果本轮迭代中的适应度高于上一轮迭代的适应度,则更新;对于每个智能体,都根据新的适应度计算质量,引力常数也会随着迭代次数的增加而更新,即随着时间的变化,重力值也会随之变化;用新质量和重力值计算加速度;在搜索空间中移动智能体的位置。虚拟机放置降低能耗,同时提高云计算性能。

Patent Agency Ranking