-
公开(公告)号:CN112612613A
公开(公告)日:2021-04-06
申请号:CN202011574923.X
申请日:2020-12-28
Applicant: 湖南大学
Abstract: 本发明公开了一种虚拟分布式异构环境下实现多GPU调度的方法,其根据OpenStack创建的虚拟环境下的GPU集群,将GPU本地任务划分为更细粒度的GPU本地子任务,然后根据数据本地性以及从节点上所有GPU的流状态和内存资源状态将GPU本地子任务调度到指定GPU上执行,并对超过GPU硬件工作队列数量的CUDA流进一步调整主机调度任务的顺序消除“虚假依赖”,以及对机器学习/深度学习每次迭代产生的中间数据进一步处理来提高GPU内存利用率从而充分平衡各个GPU上的工作负载,降低OpenStack创建的虚拟环境下GPU应用程序的执行时间。本发明能解决现有分布式异构OpenStack处理框架创建的多GPU环境中存在的吞吐量低、无法有效利用多个GPU、以及由于缺乏有效GPU负载均衡策略导致时间开销大的技术问题。
-
公开(公告)号:CN115859117A
公开(公告)日:2023-03-28
申请号:CN202211656348.7
申请日:2022-12-22
Applicant: 湖南大学
IPC: G06F18/214 , G06F18/241 , G06N3/0464 , G06N3/084
Abstract: 本发明公开了一种改进深度学习模型分布式数据并行训练效率的方法,首先,在预训练阶段,判断深度学习模型的所有层中哪些相邻层一起执行梯度通信能够使迭代时间最短,以得到梯度合并策略;其次,在正式训练的参数同步阶段,所有节点按照梯度合并策略执行分组式的梯度通信。本发明能够解决现有基于通信计算重叠和梯度合并的分布式深度学习分布式数据并行训练中存在的训练效率低的问题,使得每次迭代训练的用时更短,分布式深度学习更加高效。
-
公开(公告)号:CN112749253B
公开(公告)日:2022-04-05
申请号:CN202011574822.2
申请日:2020-12-28
Applicant: 湖南大学
Abstract: 本发明公开了一种基于文本关系图的多文本摘要生成方法,其包括三个阶段:第一个阶段是根据所有输入文本,构建文本之间的关系图,并对文本进行特征提取;第二个阶段是利用第一阶段生成的文本关系图数据和文本特征,结合图神经网络进行高阶特征提取。第三个阶段是对前两个阶段编码的文本特征进行解码,生成摘要。在第二个阶段中,是将构建的文档关系图和经过编码器编码的文档表征作为图卷积神经网络的输入,进行前向传播,提取更高阶的文本特征,使得图中每个文档节点都可以获得领域节点信息,丰富了文档表征。本发明在多个文档输入时可以有效捕捉其相互间关系,克服传统方法不能充分利用文本之间关系的缺陷。
-
公开(公告)号:CN116090528B
公开(公告)日:2025-05-13
申请号:CN202211670584.4
申请日:2022-12-25
Applicant: 湖南大学
IPC: G06N3/063
Abstract: 本发明公开了一种面向AI的跨域数据并行训练调度方法。所述方法包括如下步骤:(1)在跨域多数据中心之间建立广域网,使各数据中心的参数服务器与全局参数服务器之间可以在广域网下互相通信;在单个数据中心内部建立高速局域网,使数据中心内的工作节点可以在高速局域网下通信;(2)基于步骤(1)搭建的通信网络,各数据中心在本地数据集上使用随机梯度下降算法训练本地的神经网络模型,在达到最大迭代次数后,聚合各数据中心的神经网络模型参数,得到全局神经网络模型参数。
-
公开(公告)号:CN117892840A
公开(公告)日:2024-04-16
申请号:CN202410064364.X
申请日:2024-01-16
Applicant: 湖南大学
IPC: G06N20/00 , G06N3/0464
Abstract: 本发明公开了一种用于联邦学习算力网络的合谋攻击溯源方法,包括:服务端将初始卷积神经网络CNN模型发送到计算环境中的每个客户端,其中发给第i个客户端的CNN模型的损失函数中嵌入了与该第i个客户端对应的指纹向量,服务端接收来自每个客户端的CNN模型,并对来自每个客户端的CNN模型进行解析,以获取该CNN模型对应的损失函数,并从该损失函数中提取当前指纹向量,并根据所有客户端对应的当前指纹向量构建指纹向量矩阵a’,服务端根据指纹向量矩阵a’进行更新处理,以得到更新后的指纹向量矩阵a”,服务端根据更新后的指纹向量矩阵a”确定执行攻击的客户端。本发明能够解决现有恶意攻击检测方法通信开销大、算力成本高的技术问题。
-
公开(公告)号:CN115908916A
公开(公告)日:2023-04-04
申请号:CN202211443275.3
申请日:2022-11-17
Applicant: 湖南大学
IPC: G06V10/764 , G06V10/774 , G06N3/084 , G06N3/04
Abstract: 本发明公开了一种基于分布式深度学习的商品图像识别方法,包括步骤:主节点获取多个商品图片{p0,p1,...,pn‑1},并将所有商品图片平均分配给所有从节点,第i个从节点根据所需识别所有商品图片对应的图片序号集合Assignmenti,对图片序号集合对应的每个商品图片重新设置长宽大小,并经过标准化处理后,得到该商品图片对应的张量T,所有商品图片对应的张量共同构成张量集合{Ti},第i个从节点将步骤(2)得到的所有商品图片对应的张量集合{Ti}中的所有张量依次输入训练好的深度神经网络模型中,以得到识别结果集合{resi},并将识别结果集合{resi}发送至主节点,识别结果集合{resi}中的每个元素均为二元组(index,class),本发明能够解决利用深度学习进行图片分类对设备要求门槛高的技术问题。
-
公开(公告)号:CN112783644A
公开(公告)日:2021-05-11
申请号:CN202011629933.9
申请日:2020-12-31
Applicant: 湖南大学
IPC: G06F9/50 , G06F16/2455
Abstract: 本发明公开了一种基于高频键值计数的分布式倾斜流处理方法和系统,其基本思路在于,使用计数式布隆过滤器对数据流中每个数据项进行计数,根据频数将该数据项分别识别为高频键、潜在高频键和低频键,进而得到不同数据项的分布,对高频键采用添加随机后缀再分组聚合的策略分配下游实例,对非高频键采用键值分组策略分配下游实例,从而实现不同下游实例间的负载均衡,提高系统性能。本发明能解决倾斜流处理方法中的随机分组下游实例的内存开销极大和键值分组下游实例间负载不均衡的技术问题。
-
公开(公告)号:CN112749253A
公开(公告)日:2021-05-04
申请号:CN202011574822.2
申请日:2020-12-28
Applicant: 湖南大学
Abstract: 本发明公开了一种基于文本关系图的多文本摘要生成方法,其包括三个阶段:第一个阶段是根据所有输入文本,构建文本之间的关系图,并对文本进行特征提取;第二个阶段是利用第一阶段生成的文本关系图数据和文本特征,结合图神经网络进行高阶特征提取。第三个阶段是对前两个阶段编码的文本特征进行解码,生成摘要。在第二个阶段中,是将构建的文档关系图和经过编码器编码的文档表征作为图卷积神经网络的输入,进行前向传播,提取更高阶的文本特征,使得图中每个文档节点都可以获得领域节点信息,丰富了文档表征。本发明在多个文档输入时可以有效捕捉其相互间关系,克服传统方法不能充分利用文本之间关系的缺陷。
-
公开(公告)号:CN112783644B
公开(公告)日:2023-06-23
申请号:CN202011629933.9
申请日:2020-12-31
Applicant: 湖南大学
IPC: G06F9/50 , G06F16/2455
Abstract: 本发明公开了一种基于高频键值计数的分布式倾斜流处理方法和系统,其基本思路在于,使用计数式布隆过滤器对数据流中每个数据项进行计数,根据频数将该数据项分别识别为高频键、潜在高频键和低频键,进而得到不同数据项的分布,对高频键采用添加随机后缀再分组聚合的策略分配下游实例,对非高频键采用键值分组策略分配下游实例,从而实现不同下游实例间的负载均衡,提高系统性能。本发明能解决倾斜流处理方法中的随机分组下游实例的内存开销极大和键值分组下游实例间负载不均衡的技术问题。
-
公开(公告)号:CN112612613B
公开(公告)日:2023-06-23
申请号:CN202011574923.X
申请日:2020-12-28
Applicant: 湖南大学
Abstract: 本发明公开了一种虚拟分布式异构环境下实现多GPU调度的方法,其根据OpenStack创建的虚拟环境下的GPU集群,将GPU本地任务划分为更细粒度的GPU本地子任务,然后根据数据本地性以及从节点上所有GPU的流状态和内存资源状态将GPU本地子任务调度到指定GPU上执行,并对超过GPU硬件工作队列数量的CUDA流进一步调整主机调度任务的顺序消除“虚假依赖”,以及对机器学习/深度学习每次迭代产生的中间数据进一步处理来提高GPU内存利用率从而充分平衡各个GPU上的工作负载,降低OpenStack创建的虚拟环境下GPU应用程序的执行时间。本发明能解决现有分布式异构OpenStack处理框架创建的多GPU环境中存在的吞吐量低、无法有效利用多个GPU、以及由于缺乏有效GPU负载均衡策略导致时间开销大的技术问题。
-
-
-
-
-
-
-
-
-