-
公开(公告)号:CN115374921A
公开(公告)日:2022-11-22
申请号:CN202210924349.9
申请日:2022-08-02
Applicant: 西安交通大学
Abstract: 本公开揭示了一种基于复杂指令集的RISC‑V核,其特征在于:基于复杂指令集,即CISC指令集的RISC‑V核做为神经网络加速器的数据加载及各层计算的控制核心,同时,在RISC‑V核的控制下,将网络的输入输出数据按照硬件存储格式进行重排。本公开能够提高FPGA硬件对于神经网络的计算效率,从而得以进一步实现一种基于RISC‑V调度的FPGA神经网络加速器。
-
公开(公告)号:CN115373744A
公开(公告)日:2022-11-22
申请号:CN202210924350.1
申请日:2022-08-02
Applicant: 西安交通大学
Abstract: 本公开揭示了一种选用RISC‑V指令集架构作为处理器的基本实现,提出了一种基于RISC‑V的端侧DNN场景下的拓展VM指令集编码方法。本公开针对DNN场景扩展了一套自定义的RISC‑V向量拓展和矩阵拓展指令。并且,本公开给出了向量指令集和矩阵指令集指令的具体编码方式。此外,本公开还提出了相应的处理器。
-
公开(公告)号:CN119250134A
公开(公告)日:2025-01-03
申请号:CN202411226583.X
申请日:2024-09-03
Applicant: 西安交通大学
IPC: G06N3/0495 , G06N3/0464 , G06N3/08 , G06N3/045 , G06N5/04
Abstract: 本发明提供了一种人工神经网络数据压缩装置和方法,浮点数据采集模块用于获取人工神经网络的浮点数据;浮点数据存储模块用于存储以共享指数浮点格式存在的浮点数据;浮点数据运算模块用于将以共享指数浮点格式存在的浮点数据进行人工神经网络正向运算;其中,所述共享指数浮点格式具体是将n个浮点数据编码为一个块,块中的每个数据由E、S和M三部分组成,分别代表指数、符号和尾数部分,根据E和共享指数Es之间的差异edif向右移位。该装置能够利用共享指数实现高数据压缩率,同时在低精度格式上保持良好的DNN模型精度,并且比现有的低精度浮点格式更适合端侧设备的乘积电路实现。
-
公开(公告)号:CN110909666B
公开(公告)日:2022-10-25
申请号:CN201911143330.5
申请日:2019-11-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于改进型YOLOv3卷积神经网络的夜间车辆检测方法,属于辅助驾驶领域。通过增加输入图像尺寸、网格划分密度和多尺度训练,使YOLOv3卷积神经网络对于小目标检测更加准确。从而更加精准的识别面积较小的车尾灯;同时,针对夜间行车环境中复杂的灯光干扰,在darknet53特征提取网络中加入了通道注意力机制‑改进型SE‑Block模块。对不同重要程度的信息进行了加权操作,从而对重要信息进行强化,对不重要信息进行抑制;针对没有开源的夜间车辆数据集,构建了一个新的夜间车辆数据集。填补了这方面的空缺。最终通过对YOLOv3卷积神经网络的改进,使其更加适合夜间车辆识别。在小目标和复杂灯光干扰的环境中可以更加准确、快速地识别夜间车辆。
-
公开(公告)号:CN110909666A
公开(公告)日:2020-03-24
申请号:CN201911143330.5
申请日:2019-11-20
Applicant: 西安交通大学
Abstract: 本发明公开了一种基于改进型YOLOv3卷积神经网络的夜间车辆检测方法,属于辅助驾驶领域。通过增加输入图像尺寸、网格划分密度和多尺度训练,使YOLOv3卷积神经网络对于小目标检测更加准确。从而更加精准的识别面积较小的车尾灯;同时,针对夜间行车环境中复杂的灯光干扰,在darknet53特征提取网络中加入了通道注意力机制-改进型SE-Block模块。对不同重要程度的信息进行了加权操作,从而对重要信息进行强化,对不重要信息进行抑制;针对没有开源的夜间车辆数据集,构建了一个新的夜间车辆数据集。填补了这方面的空缺。最终通过对YOLOv3卷积神经网络的改进,使其更加适合夜间车辆识别。在小目标和复杂灯光干扰的环境中可以更加准确、快速地识别夜间车辆。
-
公开(公告)号:CN115374920A
公开(公告)日:2022-11-22
申请号:CN202210924133.2
申请日:2022-08-02
Applicant: 西安交通大学
Abstract: 本公开揭示了一种加速神经网络计算的多NPU级联结构,包括多个神经网络计算单元NPU,多个块存储器block memory,一个直接存储器存取DMA和一个主存储器DDR,该级联结构能够使所述多个神经网络计算单元NPU并行计算,只有神经网络构建模块的输入和输出需要访存主存储器。本公开所揭示的级联结构能显著提高神经网络MAC的利用率,高效访问主存储器,对于解决神经网络计算访存效率低这一性能瓶颈具有十分重要的意义。
-
公开(公告)号:CN115374919A
公开(公告)日:2022-11-22
申请号:CN202210923137.9
申请日:2022-08-02
Applicant: 西安交通大学
Abstract: 本公开揭示了一种神经网络前处理方法,其特征在于:如果每次卷积需要m个点的n个通道数据,则重排时:在第1列,先自下向上排列第1个点至第m个点所涉及的m*n个数;进一步的,如果卷积步长是k,则自左向右继续重排至第2列时:第k+1个点的n个通道的数据先从下面开始排列;然后,依次自下向上排列第k+2个点,一直到第k+m个点;进一步的,当重排到第i+1列时,自下向上依次排列:第i*k+1,i*k+2,…,i*k+m个点的n个通道数据。本公开应用范围广泛,可使用在各种网络加速方案,以及多种处理器中,达到提高内存利用率,降低图像卷积计算用时的作用。
-
公开(公告)号:CN115373598A
公开(公告)日:2022-11-22
申请号:CN202210923740.7
申请日:2022-08-02
Applicant: 西安交通大学
Abstract: 本公开揭示了计算机实现的数据处理方法,包括步骤:S100:从源存储器读取图像数据,其中源存储器具有源存储格式,其中对源存储器的读取是以适用于源存储器的模式进行的;S200:把图像数据从源存储格式转置成不同于源存储格式的目的地存储格式,其中源存储格式和目的地存储格式中的一个是HWC8存储格式,而源存储格式和目的地存储格式中的另一个是HWC88存储格式;S300:把图像数据写入到目的地存储器,其中目的地存储器具有目的地存储格式,其中对目的地存储器的读取是以适用于目的地存储器的格式进行的。本公开利用HWC88存储格式具有更好的局部性,可以提高cache中数据的利用率,进而提升数据传输带宽和计算性能。
-
-
-
-
-
-
-