-
公开(公告)号:CN109614149B
公开(公告)日:2020-10-02
申请号:CN201811314509.8
申请日:2018-11-06
Applicant: 海南大学
Abstract: 本发明实施例提供对称矩阵的上三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的对称矩阵上三角部分各元素对应的存储模块;地址生成电路,用于计算所述待存取的对称矩阵上三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的对称矩阵上三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作。本发明实施例只需对对称矩阵的上三角部分进行存储,并支持并行读取并恢复对称矩阵的任意行向量和列向量,能够充分利用硬件的并行计算单元,从而可将对称矩阵运算的算法效率提升到通用矩阵运算的算法效率层次。
-
公开(公告)号:CN109558170A
公开(公告)日:2019-04-02
申请号:CN201811314543.5
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F9/38
CPC classification number: G06F9/3853 , G06F9/3887
Abstract: 本发明提供一种支持数据级并行和多指令融合的二维数据通路架构,包括逐层依次设置的并行乘法单元、二维算术单元和后处理单元;所述并行乘法单元由多个并行的乘法器构成,用于并行执行多路实数的相乘运算、指数运算或者旁路操作;所述二维算术单元的输入端连接所述并行乘法单元的输出端,且所述二维算术单元包括多个呈二维排布的纵向多层、各层横向并行的算术逻辑单元,各纵向多层之间以及各层横向并行的算术逻辑单元之间通过数据交换网络进行连接;所述后处理单元的输入端连接所述二维算术单元的输出端,用于执行后处理操作。本发明能够有效提高该架构在特殊数字信号处理中的普遍适用性,并有效提高架构的处理性能及效率。
-
公开(公告)号:CN109614582A
公开(公告)日:2019-04-12
申请号:CN201811315278.2
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供自共轭矩阵的下三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的自共轭矩阵下三角部分各元素对应的存储模块;地址生成电路,用于计算待存取的自共轭矩阵下三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储待存取的自共轭矩阵下三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作;取共轭模块,用于对经过混洗后的数据进行旁路操作和取共轭操作。本发明实施例只需对自共轭矩阵的下三角部分进行存储,并支持并行读取并恢复自共轭矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109857982B
公开(公告)日:2020-10-02
申请号:CN201811315320.0
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供对称矩阵的三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的对称矩阵上三角部分或下三角部分各元素对应的存储模块;地址生成电路,用于计算待存取的对称矩阵上三角部分或下三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的对称矩阵上三角部分或下三角部分各元素所对应的数据;数据混洗模块,用于对从存储模块中读取出的数据进行混洗操作。本发明实施例只需对对称矩阵的上三角部分或下三角部分进行存储,并且支持并行读取并恢复对称矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109857982A
公开(公告)日:2019-06-07
申请号:CN201811315320.0
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供对称矩阵的三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的对称矩阵上三角部分或下三角部分各元素对应的存储模块;地址生成电路,用于计算待存取的对称矩阵上三角部分或下三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的对称矩阵上三角部分或下三角部分各元素所对应的数据;数据混洗模块,用于对从存储模块中读取出的数据进行混洗操作。本发明实施例只需对对称矩阵的上三角部分或下三角部分进行存储,并且支持并行读取并恢复对称矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109635235A
公开(公告)日:2019-04-16
申请号:CN201811314439.6
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供自共轭矩阵的三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的自共轭矩阵三角部分各元素对应的存储模块;地址生成电路,用于计算所述待存取的自共轭矩阵三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的自共轭矩阵三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作;取共轭模块,用于对经过混洗后的数据进行旁路操作和取共轭操作。本发明实施例只需对自共轭矩阵的三角部分进行存储,并支持并行读取并恢复自共轭矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109558567A
公开(公告)日:2019-04-02
申请号:CN201811315346.5
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供自共轭矩阵的上三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的自共轭矩阵上三角部分各元素对应的存储模块;地址生成电路,用于计算所述待存取的自共轭矩阵上三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的自共轭矩阵上三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作;取共轭模块,用于对经过混洗后的数据进行旁路操作和取共轭操作。本发明实施例只需对自共轭矩阵的上三角部分进行存储,并支持并行读取并恢复自共轭矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算效率。
-
公开(公告)号:CN109635235B
公开(公告)日:2020-09-25
申请号:CN201811314439.6
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供自共轭矩阵的三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的自共轭矩阵三角部分各元素对应的存储模块;地址生成电路,用于计算所述待存取的自共轭矩阵三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的自共轭矩阵三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作;取共轭模块,用于对经过混洗后的数据进行旁路操作和取共轭操作。本发明实施例只需对自共轭矩阵的三角部分进行存储,并支持并行读取并恢复自共轭矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109635236B
公开(公告)日:2020-08-21
申请号:CN201811315309.4
申请日:2018-11-06
Applicant: 海南大学
Abstract: 本发明实施例提供对称矩阵的下三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的对称矩阵下三角部分各元素对应的存储模块;地址生成电路,用于计算所述待存取的对称矩阵下三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储所述待存取的对称矩阵下三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作。本发明实施例只需要对对称矩阵的下三角部分进行存储,并且支持并行读取并恢复对称矩阵的任意行向量和列向量,能够充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
公开(公告)号:CN109614582B
公开(公告)日:2020-08-11
申请号:CN201811315278.2
申请日:2018-11-06
Applicant: 海南大学
IPC: G06F17/16
Abstract: 本发明实施例提供自共轭矩阵的下三角部分存储装置和并行读取方法,所述装置包括:存储模块选择电路,用于选择待存取的自共轭矩阵下三角部分各元素对应的存储模块;地址生成电路,用于计算待存取的自共轭矩阵下三角部分各元素在其对应的存储模块中的逻辑地址;并行的m个存储模块,用于存储待存取的自共轭矩阵下三角部分各元素所对应的数据;数据混洗模块,用于对从所述存储模块中读取出的数据进行混洗操作;取共轭模块,用于对经过混洗后的数据进行旁路操作和取共轭操作。本发明实施例只需对自共轭矩阵的下三角部分进行存储,并支持并行读取并恢复自共轭矩阵的任意行向量和列向量,能充分利用硬件的并行计算单元,提高矩阵运算算法效率。
-
-
-
-
-
-
-
-
-