-
公开(公告)号:CN119397235A
公开(公告)日:2025-02-07
申请号:CN202411428569.8
申请日:2024-10-14
Applicant: 重庆邮电大学
IPC: G06F18/213 , G06N3/096 , G06N3/0464
Abstract: 本发明属于人工智能技术领域,公开了一种基于移位模块和AXI交叉矩阵的FPGA故障诊断加速器设计方法,将GHOSTNETV2作为主干网络,该网络的第一层主要卷积层对输入内容进行标准的3x3二维卷积操作,以提取特征,然后将这些特征输入到后续层进行进一步的特征提取,单独对这一层进行优化;分析了量化和数据打包对延迟的影响,比较了从32位到8位不同数据格式的不同量化方法;为不同的网络层选择了不同的量化策略;选择了Xilinx FPGA的高级综合工具HLS;将每个Xilinx DSP48E1分解为两个8×8乘法器,以最大化计算资源。本发明通过理论分析和实验获得了最优的混合精度量化策略,并决定使用知识蒸馏来保持精度,从而显著减少硬件资源的使用。
-
公开(公告)号:CN117935025A
公开(公告)日:2024-04-26
申请号:CN202311528315.9
申请日:2023-11-16
Applicant: 重庆邮电大学
IPC: G06V10/94 , G06N3/0464 , G06N3/0495 , G06N3/045 , G06N3/096 , G06V10/764 , G06V10/82 , G06N3/082
Abstract: 本发明请求保护一种基于FPGA和量化蒸馏的图像分类异构硬件加速方法,属于故障诊断领域,所述方法包括量化、知识蒸馏算法部分和硬件加速部分,整体以深度神经网络作为基础框架,通过量化蒸馏压缩模型,结合FPGA异构加速技术,通过HLS编译,软硬件协同开发IP核和堆栈开发实现算法嵌入式移植,教师网络选择GHOSTNETV2网络,通过通道剪枝和量化实现优化型轻量网络;学生网络基于深度可分离卷积,winograd加速算法和量化技术实现了轻量网络;最后引入离线蒸馏模式实现硬件友好型网络;硬件部分选择HLS实现C\RTL联合编译IP核,VITISAI堆栈开发部署到XILINX公司的MPSOC架构板卡ZYNQ。本发明不仅提高了目标分类设备的便携利用程度和效率,同时降低了成本。
-