基于FPGA局部动态重构技术的异型流水线设计方法

    公开(公告)号:CN108228966B

    公开(公告)日:2021-08-20

    申请号:CN201711278509.2

    申请日:2017-12-06

    Applicant: 复旦大学

    Abstract: 本发明属于微电子技术领域,具体为一种基于FPGA局部动态重构技术的异型流水线设计方法。本发明利用FPGA局部动态重构技术,在FPGA上划分出若干个局部可重构区块,于运行时依次动态重构,通过以时间换空间的方式循环复用FPGA可编程逻辑资源,使原本无法部署在单块FPGA上的大规模应用能够完整呈现,很大程度上突破了FPGA硬件资源的限制;此外,将重构块的重构过程作为独立流水级,与用户逻辑的运算过程并行进行,显著地增加了计算的粘性。当流水线饱和时,所有的运算‑重构过程以及结果输出、数据输入的过程均处在深度流水状态,达到同等资源消耗下的最优系统吞吐率与可接受的运算延时。本发明具有很强的通用性和扩展性。

    一种级联板间流水线的“蝶式”传输方法

    公开(公告)号:CN107844451A

    公开(公告)日:2018-03-27

    申请号:CN201710990297.4

    申请日:2017-10-23

    Applicant: 复旦大学

    CPC classification number: G06F13/4221 G06F13/102

    Abstract: 本发明属于微电子技术领域,具体涉及一种级联板间流水线的“蝶式”传输方法。本发明将主机与板卡间PCIe总线的定期通信作为独立流水级的完全流水线工作模式,使分布在各块板卡上的所有用户逻辑能以紧凑的流水线方式不间断工作,显著地增加计算的粘性。总的系统吞吐率仅取决于用户逻辑的计算耗时,不受级联板卡数量增加的影响;针对完全流水线工作模式下的数据传输进一步提出了“蝶式”构型的访存方法;通过分离读/写数据通道从而充分利用板载的双DDR控制器的带宽,相比单DDR控制器提升近一倍的传输性能。本发明适用于任意用户逻辑单元及级联板卡的数量组合,以及用户逻辑单元在不同板卡上的分配方案。

    基于四向扫描方式的区域填充算法

    公开(公告)号:CN102411788B

    公开(公告)日:2014-01-08

    申请号:CN201110243706.7

    申请日:2011-08-24

    Applicant: 复旦大学

    Inventor: 钮圣虓 陈更生

    Abstract: 本发明属于数字图像处理技术领域,具体为一种基于四向扫描方式的区域填充算法。本发明通过将二值边缘图像中特定的边缘点作为起点,对边缘图像进行四个方向的扫描,筛选出由闭合边缘线围成的闭合区域,同时有效地排除非闭合区域和边缘图像中的其他噪声。本发明实现方式简单无需复杂的运算,可以从复杂的边缘图像中准确筛选出其中的闭合区域。整个算法完全自动运行,无需人工介入,没有递归运算,非常适合于并行实现。本发明可以实现其他区域填充算法无法实现的从复杂多变边缘图像中对闭合区域的提取,同时在以并行运算为主的硬件中表现出远胜于其他算法的执行效率。

    由断点出发可并行实现的边缘连接算法

    公开(公告)号:CN102270299B

    公开(公告)日:2013-06-12

    申请号:CN201110243717.5

    申请日:2011-08-24

    Applicant: 复旦大学

    Inventor: 钮圣虓 陈更生

    Abstract: 本发明属于数字图像处理技术领域,具体为一种由断点出发可并行实现的边缘连接算法。本发明通过展开一个边长自适应的搜索框,并在其最外层边框范围内搜索可连接边缘点。从若干个可连接边缘点中筛选出最接近边缘线延长方向的边缘点作为待连接边缘点,最后将断点与待连接边缘点进行互连。整过算法可以在断点之间以并行的方式执行;算法中用到的运算只有加法和减法,没有任何其他复杂运算;可连接边缘点的搜索空间被最大程度地优化缩小;所以本发明具有其他边缘连接算法无法达到的高效率,使用以并行处理为主的GPU进行执行只需几个毫秒即可完成对512*512大小的图像的边缘连接。

    基于CNN矩阵分块的调度方法、装置、设备及存储介质

    公开(公告)号:CN114546618A

    公开(公告)日:2022-05-27

    申请号:CN202210168685.5

    申请日:2022-02-23

    Applicant: 复旦大学

    Abstract: 本申请涉及计算机网络技术领域,特别涉及一种基于CNN矩阵分块的调度方法、装置、设备及存储介质,方法包括:接收由用户提交的CNN神经网络的至少一个计算作业,并按照预设作业优先级排序方式响应每个计算作业的同时,确定每个计算作业的优先级;根据一个或多个FPGA板卡的空闲资源和已发布任务接收情况生成任务发布请求,按照预设数据依赖关系和预设作业优先级排序响应任务发布请求;基于已发布的待接收计算任务,通过预设FPGA资源调度算法进行矩阵分块,分配相应FPGA资源,以部署到一个或多个FPGA板卡上对已发布的待接收计算任务进行并行计算。由此,解决了相关技术中无法达到最优加速效果,易造成FPGA资源浪费等问题。

    基于畸变直线斜率计算的鱼眼图像校正方法

    公开(公告)号:CN102156970B

    公开(公告)日:2013-04-10

    申请号:CN201110093669.6

    申请日:2011-04-14

    Applicant: 复旦大学

    Abstract: 本发明属于数字图像处理领域,具体为一种基于畸变直线斜率计算的鱼眼图像校正方法。本发明利用径向畸变特有的几何性质,根据投影不变性原理,计算畸变直线的实际斜率,并以此为基础,通过求解线性方程组以获得多项式校正模型的参数值。这种校正方法在拥有理想校正精度的情况下显著地降低了计算复杂度。根据求解得到的校正模型,利用游程编码查找表(LUT)完成畸变图像与校正图像之间的位置映射编码,从而实现对校正图像的加权双线性插值。此方法便于硬件实现,并具有高效的实时处理能力。

    由断点出发可并行实现的边缘连接算法

    公开(公告)号:CN102270299A

    公开(公告)日:2011-12-07

    申请号:CN201110243717.5

    申请日:2011-08-24

    Applicant: 复旦大学

    Inventor: 钮圣虓 陈更生

    Abstract: 本发明属于数字图像处理技术领域,具体为一种由断点出发可并行实现的边缘连接算法。本发明通过展开一个边长自适应的搜索框,并在其最外层边框范围内搜索可连接边缘点。从若干个可连接边缘点中筛选出最接近边缘线延长方向的边缘点作为待连接边缘点,最后将断点与待连接边缘点进行互连。整过算法可以在断点之间以并行的方式执行;算法中用到的运算只有加法和减法,没有任何其他复杂运算;可连接边缘点的搜索空间被最大程度地优化缩小;所以本发明具有其他边缘连接算法无法达到的高效率,使用以并行处理为主的GPU进行执行只需几个毫秒即可完成对512*512大小的图像的边缘连接。

    一种堆叠式三维FPGA芯片的稳态热分析方法

    公开(公告)号:CN101976281A

    公开(公告)日:2011-02-16

    申请号:CN201010509009.7

    申请日:2010-10-15

    Applicant: 复旦大学

    Abstract: 本发明属于电子设计自动化技术领域,具体为一种堆叠式三维FPGA芯片的稳态热分析方法。本发明采用最小边界法,仅仅需要最小边界上的封装热模型,就可以精确估计片上的温度和功耗,一旦能够精确计算温度,则可以基于现有机制来降低温度。这种热分析方法使得堆叠式三维FPGA芯片的热分析准确度更高,并简化分析流程和封装模型。基于此堆叠式三维FPGA芯片的热模型,将有限元方法作为基本的热分析算法,提出了一种精确且有效的算法进行堆叠式三维FPGA芯片的稳态热量分析,并且由于方便实现,可以快速应用于现在的设计流程。

    FPGA的单粒子多位翻转处理方法、装置、FPGA和介质

    公开(公告)号:CN116401991A

    公开(公告)日:2023-07-07

    申请号:CN202310391062.9

    申请日:2023-04-12

    Applicant: 复旦大学

    Abstract: 本发明公开了一种FPGA的单粒子多位翻转处理方法、装置、FPGA和介质。所述方法包括:确定FPGA的资源对应的物理地址、FPGA位流区域和资源状态;对FPGA进行辐射实验,并根据FPGA的资源对应的物理地址、FPGA位流区域和资源状态,提取在数据提取周期内的故障时间中设定空间的m个元素M,提取在数据提取周期内的故障时间中设定控件的元素Mi和元素Mj,确定偏移集,根据偏移集确定FPGA的单粒子多位翻转,并制定加固策略。采用本方法能够在辐射实验中直接解析FPGA内部发生的单粒子多位翻转,从而针对FPGA内部发生的单粒子多位翻转制定加固策略,提高FPGA系统的可靠性。

    一种级联板间流水线的“蝶式”传输方法

    公开(公告)号:CN107844451B

    公开(公告)日:2020-11-20

    申请号:CN201710990297.4

    申请日:2017-10-23

    Applicant: 复旦大学

    Abstract: 本发明属于微电子技术领域,具体涉及一种级联板间流水线的“蝶式”传输方法。本发明将主机与板卡间PCIe总线的定期通信作为独立流水级的完全流水线工作模式,使分布在各块板卡上的所有用户逻辑能以紧凑的流水线方式不间断工作,显著地增加计算的粘性。总的系统吞吐率仅取决于用户逻辑的计算耗时,不受级联板卡数量增加的影响;针对完全流水线工作模式下的数据传输进一步提出了“蝶式”构型的访存方法;通过分离读/写数据通道从而充分利用板载的双DDR控制器的带宽,相比单DDR控制器提升近一倍的传输性能。本发明适用于任意用户逻辑单元及级联板卡的数量组合,以及用户逻辑单元在不同板卡上的分配方案。

Patent Agency Ranking