-
公开(公告)号:CN112766479A
公开(公告)日:2021-05-07
申请号:CN202110100516.3
申请日:2021-01-26
Applicant: 东南大学
Abstract: 本发明公开一种基于FPGA的支持通道分离卷积的神经网络加速器,该加速器包括:Ping‑Pong寄存器文件、可配置数据流的输出特征值行映射单元ORMU阵列、功能单元模块以及存储器接口模块等;Ping‑Pong寄存器文件从控制处理器接受配置和控制字,完成计算后发出中断信号;ORMU阵列采用可配置的片上网络将ORMU单元和缓存互联,以满足不同数据带宽需求的神经网络的计算;功能单元模块用以实现Pooling池化、Relu激活以及批量归一化BN等功能;存储器接口模块用以传输权重和特征值。本发明通过灵活的分层网状片上网络,以支持通道分离卷积(逐通道卷积和逐点卷积)、传统卷积以及全连接对数据带宽的不同需求,从而保证较高的计算单元的利用率,极大的提升了推理/计算速度。
-
公开(公告)号:CN110390383B
公开(公告)日:2021-04-06
申请号:CN201910554531.8
申请日:2019-06-25
Applicant: 东南大学
Abstract: 本发明公开了一种基于幂指数量化的深度神经网络硬件加速器,涉及深度神经网络卷积计算硬件加速的处理器结构,属于计算、推算、计数的技术领域。硬件加速器包括:AXI‑4总线接口、输入缓存区、输出缓存区、权重缓存区、权重索引缓存区、编码模块、可配置状态控制器模块、PE阵列。输入缓存区和输出缓存区设计成行缓存结构;编码器依据有序量化集对权重编码,该量化集存放所有权重量化后的绝对值可能取值。加速器计算时,PE单元从输入缓存区、权重索引缓存区读取数据进行移位计算,将计算结果送至输出缓存区。本发明用移位运算代替浮点乘法运算,降低了对计算资源、存储资源以及通信带宽的要求,进而提高了加速器计算效率。
-
公开(公告)号:CN111294020A
公开(公告)日:2020-06-16
申请号:CN202010142983.8
申请日:2020-03-04
Applicant: 东南大学
Abstract: 本发明公开了一种高速低功耗的抗软错误锁存器,可全方位容忍单节点软错误的产生,包含三个传输门、两个2P-1N结构单元(PN1、PN2)、两个钟控反相器(C1、C2)以及一个钟控C单元(C3)。三个传输门的输出信号分别与两个2P-1N结构单元的输入对称相连,两个2P-1N结构单元的输出信号不仅作为两个钟控反相器的输入信号,而且还作为钟控C单元的输入信号,两个钟控反相器的输出作为反馈信号与两个2P-1N结构单元的输入相连,钟控C单元的输出信号作为锁存器的最终输出。本发明不仅可实现全方位容忍单节点软错误,速度快、功耗低,具有良好的稳定性,而且可用于时钟门控电路,拥有较高的可扩展性。
-
公开(公告)号:CN107505498B
公开(公告)日:2019-12-10
申请号:CN201710768128.6
申请日:2017-08-31
Applicant: 东南大学
IPC: G01R19/04
Abstract: 本发明公开了一种峰值和谷值检测电路,包括峰值检测模块、谷值检测模块、与门和结果输出模块,输入信号分别输入峰值检测模块和谷值检测模块,输入峰值检测模块和谷值检测模块检测的结果实时输入到与门的输入端,与门输出端与输出模块连接;峰值检测模块用于将输入信号与预设的峰值参考电压进行比较,如果输入信号不小于预设的峰值参考电压,则输出高电平,否则输出低电平;谷值检测模块用于将输入信号与预设的谷值参考电压进行比较,如果输入信号不大于预设的谷值参考电压,则输出高电平,否则输出低电平;结果输出模块根据与门输入的信号输出结果。本发明能够快速检测信号峰值是否达到预期值;有效避免脉冲噪声对检测结果产生干扰;结构简单,功耗低。
-
公开(公告)号:CN108759846A
公开(公告)日:2018-11-06
申请号:CN201810527432.6
申请日:2018-05-29
Applicant: 东南大学
CPC classification number: G01C21/26 , G06N3/0454 , G06N3/0481 , G06N3/084
Abstract: 本发明公开了一种自适应扩展卡尔曼滤波噪声模型建立方法,包括:采集传感器数据,记录每次扩展卡尔曼滤波计算中观测值与预测值之间的差值与滤波计算后姿态中航向角的变化值,并计算观测值与预测值之间的差值与滤波计算后姿态中航向角的变化值之间的相关系数;根据观测值与预测值之间的差值与滤波计算后姿态中航向角的变化值之间的相关系数建立观测噪声模型;将噪声模型所需的参数作为神经网络的输入,将目标值作为神经网络对应的输出,进行神经网络模型训练,得到观测噪声模型的最优参数。提取外界环境影响与传感器数据之间的关系,并通过神经网络寻找最优模型参数,使外界环境对行走航迹推算的影响达到最小。
-
公开(公告)号:CN103491375B
公开(公告)日:2018-11-02
申请号:CN201310205175.1
申请日:2013-05-29
Applicant: 东南大学
IPC: H04N19/124 , H04N19/60
Abstract: 本发明公开了一种基于binDCT的JPEG压缩系统重点改进在压缩算法方面,采用的算法为新兴binDCT算法。在这种算法中,所有系数为二进制和所有的乘法被代替为移位和加法操作,因此可以更简单和快速的通过硬件和软件实现。通过二进制DCT算法降低了DCT转换的复杂性,同时相对传统算法,本发明以牺牲一定的图像质量作为代价,提高图像的压缩率,因而可以广泛应用与类似无线头监控等各种无线多媒体传感网系统中。
-
公开(公告)号:CN104092523B
公开(公告)日:2017-07-28
申请号:CN201410370854.9
申请日:2014-07-30
Applicant: 东南大学
CPC classification number: Y02D70/00
Abstract: 本发明公开了一种多流竞争场景下的无线传感网络数据传输方法。其采用数据量感知的自适应唤醒机制以及接收节点发放令牌机制,根据接收节点回复的ACK帧指定下一次发送节点的ID号,减少了网络退避延时;同时根据ACK帧中携带的数据量来设定竞争节点休眠时长,解决了竞争节点长时间唤醒问题,降低竞争节点的能耗,延长网络寿命。本发明提出的数据传输方法,特别适用于多流高负载传输场景,在低流量负载场景下依然具有较好的性能表现。
-
公开(公告)号:CN105930591A
公开(公告)日:2016-09-07
申请号:CN201610261567.3
申请日:2016-04-26
Applicant: 东南大学
IPC: G06F17/50
CPC classification number: G06F17/5045 , G06F17/5068
Abstract: 本发明提供了一种寄存器聚类在时钟树综合上的实现方法,该寄存器聚类方法以降低时钟树互连电容为标准,通过最小生成树的构筑方式,得到时钟树寄存器的最小生成树,使得时钟树的互连线长趋于一个最小值,进而降低时钟树的功耗。在进行寄存器聚类时,通过给寄存器簇设置负载电容的阈值,使得本地寄存器簇的时钟偏移和时钟延时得到控制。通过给寄存器簇分配最合适的缓冲器,使得时钟偏移和时钟延时得到降低并为时钟树综合做好标记。整个寄存器聚类过程都未移动任何寄存器的物理位置,算法以Tcl语言实现,且仅在IC Compiler中编译运行,使得实施操作更为简易。
-
公开(公告)号:CN103067008B
公开(公告)日:2016-09-07
申请号:CN201210559873.7
申请日:2012-12-21
Applicant: 东南大学
IPC: H03M1/10
Abstract: 本发明公开了一种高精度ADC线性度的测试方法,其只需采用以低线性度信号源以及一偏置电压源即可实现,测试成本低。测试过程中,低线性度信号源产生两个低线性度的信号作为待测高精度ADC的输入信号,两输入信号之间相隔一个固定偏置电压,这一固定偏置电压由偏置电压源提供,得到高精度ADC在两输入信号下的输出结果后,再结合两输入信号下的方程即可计算出待测高精度ADC的非线性即线性度,这也在一定程度上降低了测试难度。
-
公开(公告)号:CN103176445B
公开(公告)日:2016-01-20
申请号:CN201210560381.X
申请日:2012-12-21
Applicant: 东南大学
IPC: G05B19/418
Abstract: 本发明公开了一种基于BLC2200的智能家居控制系统及其控制方法,其包括:用户端,用于向智能家居控制器发送操作命令;智能家居控制器,用于接收用户端发出的操作命令,并向智能家居设备发送控制命令;智能家居设备,用于接收智能家居控制器发出的操作命令,并响应该操作命令,同时智能家居设备也能够向智能家居控制器发送反馈命令。采用射频控制技术取代红外遥控技术,解决了可视距离限制问题和单向通信问题,为控制各类家电设备提供了很大的便利性,另外,智能家居控制系统采用低功耗技术,延长了遥控器的使用寿命。
-
-
-
-
-
-
-
-
-