RRAM/SRAM比特级混合存算一体片上训练加速器

    公开(公告)号:CN117494783A

    公开(公告)日:2024-02-02

    申请号:CN202311539083.7

    申请日:2023-11-17

    Abstract: 本发明提供了一种RRAM/SRAM比特级混合存算一体片上训练加速器,包括顶层控制器、激活值缓冲、前向传播、层输出缓冲、权重梯度计算和权重更新模块,其中,前向传播模块包括RRAM存算一体单元合SRAM存算一体单元,分别存储有MSB(高有效位)权重和LSB(低有效位)权重,用于根据控制指令和激活值进行神经网络前馈计算,得到前馈输出值;权重梯度计算根据激活值和前馈输出值进行计算,得到权重梯度;权重更新模块根据LSB权重、权重梯度和学习率,对前向传播模块的LSB权重和MSB权重分别进行密集更新合稀疏更新,前馈输出值为神经网络的一层的最终计算结果。总之,本方法能够实现神经网络训练的高耐久度和推理的高能效。

    三维芯粒系统及其计算方法
    2.
    发明公开

    公开(公告)号:CN117875386A

    公开(公告)日:2024-04-12

    申请号:CN202410059895.X

    申请日:2024-01-15

    Abstract: 提供了三维芯粒系统,包括:衬底;N层芯粒,每一层芯粒具有无金属区域和金属区域、多个IO端、以及第一硅通孔通道和第二硅通孔通道,其中N是大于等于2的整数,第一硅通孔通道贯穿每一层芯粒的无金属区域,第一层芯粒至第N‑1层芯粒中的每一层芯粒的第一硅通孔通道连接至一个IO端进而通过一个凸块单元与下一层芯粒的第一硅通孔通道连接;第一层芯粒至第N‑1层芯粒中的每一层芯粒的金属区域通过第二硅通孔通道连接至另一个IO端进而通过另一个凸块单元与下一层芯粒的金属区域连接;第N层芯粒的多个IO端通过衬底侧凸块单元与衬底连接。利用分别的第一硅通孔通道和第二硅通孔通道来连接N层芯粒以实现N层芯粒之间读写分离的数据通信。

    喉部运动信息捕获系统
    3.
    发明授权

    公开(公告)号:CN116098608B

    公开(公告)日:2024-09-10

    申请号:CN202111326124.5

    申请日:2021-11-10

    Abstract: 本申请公开了一种喉部运动信息捕获系统,包括:数据采集模块,包括语音传感器、电声门传感器和惯性传感器,语音传感器和电声门传感器分别用于获取人体喉部发声过程中的音频信号和电声门信号,惯性传感器包括加速计传感器和陀螺仪传感器,用于获取人体喉部发声过程中喉头活动的生理信号;信号处理电路,用于接收所述数据采集模块采集的信号并进行ADC转换、滤波和降噪处理;数字处理电路,用于接收所述信号处理电路的信号并进行特征提取和数据融合;和无线通信模块,用于将所述数字处理电路处理后的数据传输给终端设备。本发明实现语音数据高精度、高速度、多通道的实时采集与处理,同时实现数据的无线传输,达到便携目的。

    一种基于医疗行为数据的医疗行为操作合规性评估系统

    公开(公告)号:CN111916191B

    公开(公告)日:2024-07-02

    申请号:CN202010711862.0

    申请日:2020-07-22

    Applicant: 复旦大学

    Abstract: 本发明涉及一种基于医疗行为数据的医疗行为操作合规性评估系统,包括:多模态数据融合处理模块:用于对多模态的医疗行为数据进行数据融合处理,获取具有时空表征的医疗行为数据;基于云计算的数据标注模块:用于通过专家法对部分医疗行为数据进行标注,采用云计算的学习方式进行学习、分类和标注,构建数据集;直觉推理医疗行为评估模块:用于对数据集依次进行特征提取与分类、时空特征分析、根据医疗行为先验知识进行直觉推理,获取医疗行为操作合规性评估结果;边缘计算智能终端模块:用于进行数据处理以及人机交互。与现有技术相比,本发明具有实时反应能力快、数据分析全面、评价科学合理等优点。

    一种高能效的存边计算电路
    5.
    发明公开

    公开(公告)号:CN115565581A

    公开(公告)日:2023-01-03

    申请号:CN202211390766.6

    申请日:2022-11-07

    Abstract: 本申请涉及一种高能效的存边计算电路,其包括存储阵列模块,连接有用于读写内部存储器的位线和字线,所述位线和字线与存储器一一对应;读写控制驱动模块,耦接于各位线和字线,用于接收权重参数并将权重参数读写于SRAM存储阵列模块;存边运算模块,包括若干存边计算单元,各存边计算单元分别耦接于一字线和一激活信息输入线,所述存边计算单元从字线接收SRAM存储阵列模块内存储器的所存储的权重参数,从激活信号输入线接收激活信息,并对接收到的权重参数和激活信息进行运算并输出。本申请具有提高芯片计算性能以达到实时进行人工智能任务处理的效果。

    一种适用于SLAM非线性并行化芯片计算架构及工作方法

    公开(公告)号:CN114691345A

    公开(公告)日:2022-07-01

    申请号:CN202011564008.2

    申请日:2020-12-25

    Applicant: 复旦大学

    Abstract: 本发明公开了一种适用于SLAM非线性并行化芯片计算架构,包括至少一个基于脉动阵列的块结构并行化矩阵乘加单元,用于将大规模矩阵分解成最大为6×6规模的块结构矩阵并行化的乘加操作;至少一个求解大规模对称正定矩阵方程的预处理共轭梯度方法的迭代求解器;以及硬件映射模块用于SLAM后端优化中复杂数据流的处理分析。本发明提供了针对SLAM后端优化的一种加速架构,实现了基于光束平差法的后端优化硬件运算加速器,能够灵活适用于各种SLAM算法的后端优化组件的运算,具有配置灵活、运算速度快、功耗低。

    基于可控非对称动态比较器的1.5比特冗余加速逐次逼近型模数转换器

    公开(公告)号:CN106067817B

    公开(公告)日:2019-02-26

    申请号:CN201610411806.9

    申请日:2016-06-14

    Applicant: 复旦大学

    Abstract: 本发明属于集成电路技术领域,具体为基于可控非对称动态比较器的1.5比特冗余加速的逐次逼近型模数转换器。本发明提供的模数转换器结构包括两个相同的栅压自举开关,一组对称的N位二进制电容阵列,两个可控非对称动态比较器,一个普通动态比较器和SAR ADC的数字逻辑电路模块。本发明引入1.5比特冗余加速技术,缩短了等待前几位建立完全的时间,加快了模数转换器的转换速率,增加了冗余度,减少误码、失码,提高精度。相比于传统技术,能够大幅度简化电路规模,特别是省略参考电压产生电路,继而降低模数转换器的功耗和面积,迅速变化建立等效参考电压值,加快模数转换器的转换速度,且具有普适性,可以应用于其他0.5比特的应用场景。

    一种高兼容性可编程神经网络加速阵列

    公开(公告)号:CN107817708A

    公开(公告)日:2018-03-20

    申请号:CN201711131564.9

    申请日:2017-11-15

    Applicant: 复旦大学

    Abstract: 本发明属于集成电路技术领域,具体为一种高兼容性可编程神经网络加速阵列。该阵列采用可重构性架构,包含一个中央控制器、一个特征向量发射器以及若干个神经网络计算单元片;所述计算单元片含有可编程乘加单元、可编程激活单元、单元片控制器等基本的神经网络计算模块,加速阵列通过可编程通信路由进行任意单元片间的通信。该可编程神经网络加速阵列可兼容多种神经网络算法,同时又不失去高能效,适合应用于各类深度学习智能系统中。

    基于过零比较的流水线模数转换器的校正电路及校正方法

    公开(公告)号:CN104506191A

    公开(公告)日:2015-04-08

    申请号:CN201410754786.6

    申请日:2014-12-11

    Applicant: 复旦大学

    Abstract: 本发明属于集成电路技术领域,具体涉及基于过零比较的流水线模数转换器的校正电路及校正方法。本发明提供的校正电路连接于基于过零比较的流水线模数转换器的两级电路之间,所述校正电路包括一差分1/f误差放大器、两个校正用电容、两个传输门电路;每一传输门电路包含一N型场效应晶体管和一P型场效应晶体管,两者沟道平行排布。校正电路将前一级电路的误差放大并存储在校正用电容上,然后将该误差随着后一级电路的建立过程补偿到其输出。本发明提供的校正方法,能够有效提高电路的转换精度,同时为子ADC提供比传统方案更长的转换时间,因此可以减小对子ADC电路的速度要求。

Patent Agency Ranking