面向医学图像处理的端到端神经网络异构加速系统

    公开(公告)号:CN116258884A

    公开(公告)日:2023-06-13

    申请号:CN202111483409.X

    申请日:2021-12-07

    Applicant: 复旦大学

    Abstract: 本发明提供一种面向医学图像处理的端到端神经网络异构加速系统,其特征在于,包括:处理器以及可重构卷积神经网络FPGA加速核;其中,可重构卷积神经网络FPGA加速核具有片外存储器、片上参数存储器、片上偏置存储器、片上输入特征图存储器、可重构卷积计算模块输入接口、可重构卷积计算模块、可重构卷积计算模块输出接口、结果存储器,由可重构卷积计算模块输入接口将存储在片上存储系统中的权重数据、偏置数据以及输入特征图传输至可重构卷积计算模块,然后由可重构卷积计算模块对输入特征图进行图像的模态合成、分割以及分类的计算处理得到与输入特征图对应的输出结果,该端到端神经网络异构加速系统能够提高医学诊断的效率,并降低功耗。

    一种可重构卷积神经网络的硬件互连架构

    公开(公告)号:CN108647773A

    公开(公告)日:2018-10-12

    申请号:CN201810358443.6

    申请日:2018-04-20

    Applicant: 复旦大学

    Abstract: 本发明属于图像处理算法的硬件设计技术领域,具体为一种可重构卷积神经网络的硬件互连架构。本发明的互连架构包括:数据和参数片外缓存模块,用于缓存输入的待处理图片中的像素数据和缓存进行卷积神经网络计算时输入的参数;基础计算单元阵列模块,用于实现卷积神经网络的核心计算;算术逻辑单元计算模块,用于处理所述基础计算单元阵列的计算结果,实现对下采样层、激活函数以及部分和累加。其中,基础计算单元阵列模块按照二维阵列的方式互连,在行方向上,共享输入数据,通过使用不同的参数数据实现并行计算;在列方向上,计算结果逐行传递,作为下一行的输入参与运算。本发明通过结构互连提升数据复用能力的同时,能够降低带宽的需求。

    一种可兼容CAN2.0总线的具有更高速率的通信方法

    公开(公告)号:CN105262655A

    公开(公告)日:2016-01-20

    申请号:CN201510586250.2

    申请日:2015-09-16

    Applicant: 复旦大学

    Abstract: 本发明属于现场总线技术领域,具体为一种可兼容CAN2.0总线的具有高速率的通信方法。本发明采用CAN2.0的帧格式进行数据通信,在每一帧的数据场,使用倍频时序,使得数据场中具有更多的比特的数据位;为兼容CAN2.0协议,这些数据位不全部使用,采用特殊的编码方式使用倍频之后的比特位,从而得到增强型CAN总线的通信方法。本发明方法在CAN2.0总线的基础上,实现了更高速率的通信,并能兼容CAN2.0总线网络,使得同一个总线网络中可以同时实现不同速率的通信,能很好的满足当今日益复杂的电子设备通信需求。在现场可编程逻辑阵列器件上的验证结果表明,该通信方法切实可行。

    支持用户定制的可编程逻辑器件版图快速生成方法

    公开(公告)号:CN102831268A

    公开(公告)日:2012-12-19

    申请号:CN201210291806.1

    申请日:2012-08-16

    Applicant: 复旦大学

    Abstract: 本发明属于电子设计自动化技术领域,具体为一种支持用户定制的可编程逻辑阵列版图快速生成方法。本发明方法步骤为:准备单元版图并且为单元版图建立配置文件;计算单元版图的规模大小;将单元子版图进行拼接;预留用户设定的版图形状。本发明基于已有的单元版图库,能够在快速生成任意指定规模的版图文件的同时使得所生成的版图性能接近人工定制生成的版图性能。本方法生成的版图主要特点在于:一是所生成的可编程逻辑阵列版图规模大小是可定制的,即用户能够指定版图的阵列规模大小;二是根据用户设定的版图形状要求,可以自动在版图上预留这些区域,便于在可编程逻辑阵列版图中嵌入其他IP核。

    一种蛋白质鉴定方法及系统

    公开(公告)号:CN107727727A

    公开(公告)日:2018-02-23

    申请号:CN201711113675.7

    申请日:2017-11-13

    Applicant: 复旦大学

    Abstract: 本发明属于生物分析技术领域,具体为一种蛋白质鉴定方法及系统。本发明方法包括:根据蛋白酶对待测蛋白质进行酶切操作,利用蛋白质串联质谱技术获得待测蛋白质的二级质谱;对蛋白质数据库中的蛋白质序列进行虚拟酶切操作,提取符合要求的第一类肽段;利用FPGA加速算法根据第一类肽段生成理论谱;利用FPGA加速模块将待测蛋白质的二级质谱与理论谱对比,进行相似性打分;将得分结果最高的理论谱对应的肽段序列确定为蛋白质的肽段序列;依次确定蛋白质的所有肽段序列,得到蛋白质序列。采用本发明所提供的蛋白质鉴定方法及系统,实现了在FPGA上加速,整个打分过程加速约为25倍左右,加速效果良好,提高了系统的运行效率。

    一种用于FPGA电路位流仿真的方法

    公开(公告)号:CN103914580A

    公开(公告)日:2014-07-09

    申请号:CN201310323430.2

    申请日:2013-07-29

    Applicant: 复旦大学

    Abstract: 本发明属于电子技术领域,涉及一种用于对FPGA电路的可编程位流文件进行仿真的方法。本发明针对FDP系列的FPGA器件,使用Verilog语言对其自身功能统一进行多层次硬件建模,包括CLB、IOB和互连资源等,并在能够进行Verilog仿真的商业工具中进行仿真验证,能够实现编程数据下载和配置功能。本方法能在可编程逻辑器件的设计过程中快速验证其电路功能,并且向使用FPGA的用户提供FPGA仿真方法,能同FPGA芯片设计和应用电路设计流程无缝衔接。本方法可用于FPGA芯片流片前的设计阶段,流片后的FPGA芯片测试阶段,以及用户使用FPGA芯片进行电路设计阶段对FPGA位流文件进行仿真与验证,快速验证FPGA电路或用户电路功能的正确性。

    一种现场可编程门阵列的抗辐射性能快速模拟方法

    公开(公告)号:CN102054056B

    公开(公告)日:2012-11-14

    申请号:CN200910198448.8

    申请日:2009-11-06

    Applicant: 复旦大学

    Abstract: 本发明属于电子技术领域,具体涉及一种现场可编程门阵列的抗辐射性能快速模拟方法。该方法提出了一种与具体硬件结构无关、基于权重的错误注入模型,用于准确模拟基于SRAM的FPGA抗辐射性能;同时提出了基于JTAG边界扫描技术和动态局部重配置技术的错误注入模拟平台。结合二者的错误注入系统不但具有良好的通用性,而且能更准确更高效地进行模拟,同时成本更低。

    一种可编程逻辑器件互连资源的故障测试方法

    公开(公告)号:CN101881811B

    公开(公告)日:2012-10-24

    申请号:CN200910050875.1

    申请日:2009-05-08

    Applicant: 复旦大学

    Abstract: 本发明属于电子技术领域,具体涉及一种可编程逻辑器件互连资源的自动化故障遍历测试方法。本发明提出了一种自动生成与应用无关的测试配置集的方法,通过建立布线资源图,根据线网的走向动态设定各边的权重,利用改进的Kruskal算法自动生成测试配置集。对于FPGA不同的互连结构,该方法对互连资源中的开路和短路故障达到100%的覆盖率,且测试配置个数少,运行速度快,不依赖于特定的硬件结构。

    基于多核处理器的通用并行加速算法

    公开(公告)号:CN102214086A

    公开(公告)日:2011-10-12

    申请号:CN201110165740.7

    申请日:2011-06-20

    Applicant: 复旦大学

    Abstract: 本发明属于并行处理器技术领域,具体为一种基于多核处理器的通用并行加速算法。本发明步骤包括:对于大规模、高密度数据计算,首先识别计算过程中的数据相关性,对于数据相关度低或者相互之间没有数据相关性的计算过程,将其分解出来成为独立的计算序列;将这些计算序列分配到多核处理器的各计算核心上执行,在执行过程中调度线程实现负载平衡,并且动态管理内存实现内存对齐;在计算核心运行完计算序列后,将各计算结果片段回收组合成完整的计算结果,实现较高的计算加速比。本发明基于多核处理器,例如GPGPU和CELL处理器等,实现了大规模数据计算并行化、并行线程优化调度、与多核处理器架构相关度小的通用加速运算。

Patent Agency Ranking