-
公开(公告)号:CN119938057A
公开(公告)日:2025-05-06
申请号:CN202510014346.5
申请日:2025-01-06
Applicant: 上海大学
IPC: G06F8/41 , G06F9/50 , G06N3/0464
Abstract: 一种基于CPU/NPU协同计算的卷积神经网络编译方法,将各种CNN模型在不同网络框架下经过模型量化和压缩,以ONNX文件格式导出;通过ONNX‑MLIR工具链与NPU编译器的融合完成ONNX文件编译过程并分别生成分配到CPU和NPU的任务列表后,在CPU端,ONNX‑MLIR为CPU任务生成有效的RISC‑V指令,支持高效调度,在NPU端,定制的NPU编译器完成NPU任务在算法与硬件上的匹配并将算子高效映射到NPU平台。本发明通过功能函数并优化核心阶段,解决CNN在异构架构(RISC‑V CPU/NPU)上无法有效运行的问题,实现计算性能的显著提升。
-
公开(公告)号:CN116451743A
公开(公告)日:2023-07-18
申请号:CN202310378048.5
申请日:2023-04-11
Applicant: 上海大学
IPC: G06N3/0464 , G06N3/063
Abstract: 一种池化计算实现系统,包括:横向池化模块和纵向池化模块,其中:横向池化模块对输入的特征图进行横向池化操作并整理尺寸后输出;纵向池化模块暂存横向池化处理后的特征图并进行纵向池化操作。本发明通过高灵活性与通用性的池化操作的架构,适配多种情况下的不同尺寸的池化操作的同时,有效地节约面积的消耗。
-