-
公开(公告)号:CN106354479B
公开(公告)日:2019-01-29
申请号:CN201610664905.8
申请日:2016-08-12
Applicant: 东南大学
IPC: G06F9/38
Abstract: 本发明公开了一种大量同构稀疏矩阵的GPU加速QR分解方法,所述方法包括如下步骤:在CPU上对稀疏矩阵A1进行QR符号分解,得到Household变换矩阵V1和上三角矩阵R1的稀疏结构;对矩阵A1各列进行并行化分层,且A1~AN具有相同的稀疏结构V1、上三角矩阵稀疏结构R1和并行化分层结果;CPU将QR分解所需数据传输给GPU;任务分配和设备内存优化:将对矩阵A1~AN的QR分解任务分配到GPU上的大量线程中执行,并根据合并访问原则优化内存使用;GPU中计算分层QR分解内核函数Batch_QR。该方法利用CPU控制程序的流程,GPU处理密集浮点运算,可以大幅提高大量同构稀疏矩阵的QR分解速度。
-
公开(公告)号:CN106026107B
公开(公告)日:2019-01-29
申请号:CN201610592223.0
申请日:2016-07-26
Applicant: 东南大学
IPC: H02J3/06
Abstract: 本文公开了一种GPU加速的电力潮流雅可比矩阵的QR分解方法,所述方法包括:CPU中对雅可比矩阵J进行QR符号分解,得到Household变换矩阵V和上三角阵R阵的稀疏结构;根据R阵的稀疏结构,对矩阵J各列进行并行化分层;GPU中按层次递增的顺序计算分层QR分解内核函数SparseQR。本发明利用CPU控制程序的流程并处理基础数据和GPU处理密集的浮点运算相结合的模式提高了电力潮流雅可比矩阵QR分解的效率,解决了电力系统静态安全性分析中潮流计算耗时大的问题。
-
公开(公告)号:CN106407158A
公开(公告)日:2017-02-15
申请号:CN201610814518.8
申请日:2016-09-12
Applicant: 东南大学
Abstract: 本发明公开了一种GPU加速的批处理同构稀疏矩阵乘满向量的处理方法,所述方法包括:(1)在CPU中将所有矩阵A1~Abs存储为行压缩存储格式;(2)CPU将GPU内核函数所需数据传输给GPU;程,并优化内存访问模式;(4)GPU中执行批处理同构稀疏矩阵乘满向量内核函数spmv_batch,调用内核函数来批处理并行计算同构稀疏矩阵乘满向量。本发明中CPU负责控制程序的整体流程和准备数据,GPU负责计算密集的向量乘法,利用批处理模式提高了算法并行度和访存效率,大幅降低了批量稀疏矩阵乘满向量的计算时间。(3)将矩阵A1~Abs的乘满向量任务分配给GPU线
-
公开(公告)号:CN106157176A
公开(公告)日:2016-11-23
申请号:CN201610597129.4
申请日:2016-07-26
Applicant: 东南大学
CPC classification number: Y02D10/22 , Y02D10/36 , G06Q50/06 , G06F9/5027 , G06F2209/5018
Abstract: 本文公开了一种GPU加速的电力潮流雅可比矩阵的LU分解方法,包括CPU中对雅可比矩阵J进行LU符号分解,得到下三角变换矩阵L和上三角矩阵U矩阵的稀疏结构,符号分解之后的J的稀疏结构等于L+U;根据U阵的稀疏结构,对矩阵J各列进行并行化分层,并将计算所需数据传输给GPU;GPU中按层次递增的顺序计算分层LU分解内核函数SparseLU。本发明利用CPU控制程序的流程并处理基础数据和GPU处理密集的浮点运算相结合的模式提高了电力潮流雅可比矩阵LU分解的效率,解决了电力系统静态安全性分析中潮流计算耗时大的问题。
-
公开(公告)号:CN106157176B
公开(公告)日:2019-07-12
申请号:CN201610597129.4
申请日:2016-07-26
Applicant: 东南大学
Abstract: 本文公开了一种GPU加速的电力潮流雅可比矩阵的LU分解方法,包括CPU中对雅可比矩阵J进行LU符号分解,得到下三角变换矩阵L和上三角矩阵U矩阵的稀疏结构,符号分解之后的J的稀疏结构等于L+U;根据U阵的稀疏结构,对矩阵J各列进行并行化分层,并将计算所需数据传输给GPU;GPU中按层次递增的顺序计算分层LU分解内核函数SparseLU。本发明利用CPU控制程序的流程并处理基础数据和GPU处理密集的浮点运算相结合的模式提高了电力潮流雅可比矩阵LU分解的效率,解决了电力系统静态安全性分析中潮流计算耗时大的问题。
-
公开(公告)号:CN106294022A
公开(公告)日:2017-01-04
申请号:CN201610662283.5
申请日:2016-08-12
Applicant: 东南大学
CPC classification number: G06F11/1479 , G06Q50/06
Abstract: 本发明公开了一种用于静态安全分析的雅可比矩阵冗余存储方法,该方法包括如下步骤:电网的导纳矩阵Y,按稀疏格式存储;(2)根据基态电网的导纳矩阵Y的稀疏结构,生成稀疏格式的雅可比矩阵J,将电网中所有节点按PQ节点处理,为PV节点在雅可比矩阵J中冗余预留非零元的储存空间和电压幅值增量ΔV2的储存空间,即形成PV节点对应的冗余无功功率不平衡方程;(3)在生成基态电网的任意一个具体故障潮流的修正方程组时,雅可比矩阵J按照故障电网的实际节点类型进行解耦处理。本发明解决了批处理潮流雅可比矩阵结构不一致的问题,为批处理潮流并行计算提供了数据结构基础。(1)根据电网基础数据生成电网元件故障前基态
-
公开(公告)号:CN106294022B
公开(公告)日:2019-03-29
申请号:CN201610662283.5
申请日:2016-08-12
Applicant: 东南大学
Abstract: 本发明公开了一种用于静态安全分析的雅可比矩阵冗余存储方法,该方法包括如下步骤:(1)根据电网基础数据生成电网元件故障前基态电网的导纳矩阵Y,按稀疏格式存储;(2)根据基态电网的导纳矩阵Y的稀疏结构,生成稀疏格式的雅可比矩阵J,将电网中所有节点按PQ节点处理,为PV节点在雅可比矩阵J中冗余预留非零元的储存空间和电压幅值增量ΔV2的储存空间,即形成PV节点对应的冗余无功功率不平衡方程;(3)在生成基态电网的任意一个具体故障潮流的修正方程组时,雅可比矩阵J按照故障电网的实际节点类型进行解耦处理。本发明解决了批处理潮流雅可比矩阵结构不一致的问题,为批处理潮流并行计算提供了数据结构基础。
-
公开(公告)号:CN106021943B
公开(公告)日:2018-07-20
申请号:CN201610365460.3
申请日:2016-05-27
Applicant: 东南大学
IPC: G06F17/50
Abstract: 本发明公开了一种结合GPU软硬件架构特点设计的直流故障筛选方法,包括:根据GPU的软硬件参数对GPU的内核函数的任务分配进行优化设计:使用一个线程块计算一个开断;CPU读取电网数据,将所需的数据传送给GPU;采用两个CUDA流,使GPU在执行内核函数的同时,实现支路开断故障筛选与发电机开断故障筛选的异步执行;CUDA流1:GPU中的内核函数1和内核函数2筛选支路开断故障集S1并回传CPU中;CUDA流2:GPU中的内核函数3和内核函数4筛选发电机开断故障集S2并回传CPU中。本发明使用一个线程块来计算一个开断,所用的线程总数量增加,单个线程的计算量减少,充分利用了GPU的硬件资源和计算能力。
-
公开(公告)号:CN106354479A
公开(公告)日:2017-01-25
申请号:CN201610664905.8
申请日:2016-08-12
Applicant: 东南大学
IPC: G06F9/38
CPC classification number: G06F9/3877
Abstract: 本发明公开了一种大量同构稀疏矩阵的GPU加速QR分解方法,所述方法包括如下步骤:在CPU上对稀疏矩阵A1进行QR符号分解,得到Household变换矩阵V1和上三角矩阵R1的稀疏结构;对矩阵A1各列进行并行化分层,且A1~AN具有相同的稀疏结构V1、上三角矩阵稀疏结构R1和并行化分层结果;CPU将QR分解所需数据传输给GPU;任务分配和设备内存优化:将对矩阵A1~AN的QR分解任务分配到GPU上的大量线程中执行,并根据合并访问原则优化内存使用;GPU中计算分层QR分解内核函数Batch_QR。该方法利用CPU控制程序的流程,GPU处理密集浮点运算,可以大幅提高大量同构稀疏矩阵的QR分解速度。
-
公开(公告)号:CN106296469A
公开(公告)日:2017-01-04
申请号:CN201610816389.6
申请日:2016-09-12
Applicant: 东南大学
Abstract: 本发明公开了一种N-1故障潮流修正方程组的预处理子优化选择方法,所述方法包括如下步骤:(1)生成故障前基态电网的节点电纳矩阵Bp0;(2)对基态电纳矩阵Bp0进行LU数值分解,得到下三角矩阵L和上三角矩阵U;(3)生成所有断线故障的节点电纳矩阵Bp1~Bpbs,bs为故障数量;(4)采用预处理共轭梯度法求解所有故障潮流的修正方程组;所有故障潮流都采用基态电纳矩阵Bp0的LU分解结果作为预处理子。本发明所有故障潮流可共用一个预处理矩阵,大量节省了预处理矩阵的构建时间,而且可以大幅减少PCG法求解潮流修正方程组时所需的迭代次数,最终可大幅降低故障潮流计算时间。
-
-
-
-
-
-
-
-
-