一种面向GPU和DCU架构的Flash Sort算法优化方法

    公开(公告)号:CN116680073A

    公开(公告)日:2023-09-01

    申请号:CN202310653455.2

    申请日:2023-06-02

    Abstract: 本发明公开了一种面向GPU和DCU架构的Flash Sort算法优化方法,属于高性能计算与算法技术领域;本发明在不同级别上(device/block/wavefront)处理数组A(数组A为待排序数组),根据待排序数组内的元素数值范围设定桶的数量,并按照桶内的元素数量对数组的存储地址重新进行划分,将数组内的元素存储到对应的桶中。将线程划分为若干线程组,每个线程组共同完成一个桶内的元素的排序,每个线程负责桶内多个元素的排序,并预先在LDS上分配存储空间,有效解决了现有技术所存在的资源占用率低,总体性能不高的问题。

Patent Agency Ranking