-
公开(公告)号:CN118093143B
公开(公告)日:2024-07-02
申请号:CN202410437753.2
申请日:2024-04-12
Applicant: 清华大学
Abstract: 本公开涉及人工智能领域,尤其涉及一种大语言模型解码阶段的数据调度方法和装置,确定大语言模型解码阶段的至少一个数据操作,并在加速器片上分配片上缓存区域。对至少一个数据操作进行操作融合得到包括N个按顺序执行的数据操作的操作组合,在解码阶段获取输入激活向量以按顺序执行操作组合中的数据操作。其中,在执行第一个到第N‑1个数据操作时,完成每一次操作步骤后得到对应的中间激活向量,并通过片上缓存区域存储所述中间激活向量。在执行第N个数据操作时得到对应的输出激活向量。本公开可以通过在加速器片上开辟片上缓存区域存储解码阶段的中间参数,避免多次进行片外数据存储,有效利用计算与带宽资源提高加速器的推理效率。
-
公开(公告)号:CN116246669A
公开(公告)日:2023-06-09
申请号:CN202310259263.3
申请日:2023-03-09
Applicant: 清华大学
Abstract: 本公开涉及高密度存内计算装置、神经网络加速器及电子设备,所述装置包括:多个计算模块,包括至少一个只读存储器件、多个选择器件、激励源、存储状态数据线、控制字线、计算位线、数据选择控制线,只读存储器件的控制端接收控制信号,只读存储器件的两个数据端分别连接于不同的存储状态数据线以实现数据存储,存储状态数据线连接于激励源及计算位线,选择器件的控制端接收数据选择控制信号;控制模块,用于通过控制字线、数据选择控制线选择相应的只读存储器件及选择器件进行目标操作,并通过计算位线输出结果数据,本公开实施例提高了装置的高密度存储,提高了存内计算的面积效率,从而降低乃至消除所述装置对片外的访存。
-
公开(公告)号:CN116150084A
公开(公告)日:2023-05-23
申请号:CN202310179670.3
申请日:2023-02-28
Applicant: 清华大学
Abstract: 本公开涉及一种存内计算装置、神经网络芯片和电子设备,所述装置包括:至少一个存算单元,存算单元包括至少一个只读存储器件、读写存储器件、开关器件、控制字线、计算位线,其中,所述读写存储器件存储的控制电压用于控制所述开关器件的导通状态,以调整所述只读存储器件的控制端和所述控制字线的连接关系,所述只读存储器件的第一端接地,所述只读存储器件的第二端连接于所述计算位线;控制模块,用于:通过所述控制字线写入待操作数据;通过所述计算位线获取所述待操作数据与所述只读存储器件的存储数据的运算结果。本公开实施例可以实现高效的存内运算,并且利用只读存储器件、读写存储器件实现存算单元,可以提高存内计算装置的面积效率。
-
公开(公告)号:CN115660155A
公开(公告)日:2023-01-31
申请号:CN202211268555.5
申请日:2022-10-17
Applicant: 清华大学
IPC: G06Q10/04 , G06Q10/0631 , G06Q10/083 , G06N3/0464
Abstract: 本申请涉及人工智能技术领域,特别涉及一种多智能体多样性策略的任务执行方法、装置及智能体,其中,方法包括:获取其他所有智能体的分享信息和自身预设区域内的二维信息;根据分享信息和二维信息识别自身靠近每个任务目标的第一任务价值,以及移动任务目标距离朝向对应目标点的第二任务价值;根据第一任务价值和第二任务价值匹配最优任务目标,根据最优任务目标对应的任务类型执行独立任务动作或协作任务动作,以移动最优任务目标至对应目标点。由此,解决了相关技术的多智能体泛化性差,应用场景单一,无法同时具备独立和协作这两种互斥策略等问题。
-
公开(公告)号:CN111833888B
公开(公告)日:2022-11-11
申请号:CN202010727505.3
申请日:2020-07-24
Applicant: 清华大学
Abstract: 本公开提供了一种应用于语音关键词识别的近传感器处理的电路,包括:混合信号乘累加电路,包括:第一开关晶体管Mp、第二开关晶体管Mn、n个第一晶体管PM1、PM2、PM3...PMn、n个第二晶体管NM1、NM2、NM3...NMn、第一数字控制线第二数字控制线W0、W1、W2...Wn;其中,n≥3,所述第一晶体管PM1、PM2、PM3...PMn的宽长比为1∶2∶...∶2n‑1,所述第二晶体管NM1、NM2、NM3...PMn的宽长比为1∶2∶...∶2n‑1,可在系统识别率不变的前提下大幅提升处理速度。本公开还提供了一种应用于语音关键词识别的近传感器处理的系统及方法,可大幅降低了系统功耗。
-
公开(公告)号:CN114186291A
公开(公告)日:2022-03-15
申请号:CN202111413132.3
申请日:2021-11-25
Applicant: 清华大学
Abstract: 本申请公开了一种基于铁电晶体管的物理不可克隆函数结构及注册方法、装置,其中,结构包括:阵列电路为通过多个铁电晶体管电路结构单元电气连接构成多行多列的阵列结构,每一行电路结构单元的字线相连,且连接至译码电路,每一列电路结构单元的位线和感测线相连,且位线连接至驱动电路,感测线连接至感测电路;驱动电路用于驱动阵列电路的字线和位线;译码电路用于输入挑战信号,并将输入挑战信号译码为相应的地址;感测电路用于通过利用阵列电路中的铁晶体管极化状态随机翻转特性由输入挑战信号生成输出响应信号数据。本申请的实施例利用铁电晶体管的极化状态的随机性和多样性,实现可重构的物理不可克隆函数,具有低功耗优势。
-
公开(公告)号:CN113570036A
公开(公告)日:2021-10-29
申请号:CN202110773900.X
申请日:2021-07-08
Applicant: 清华大学
Abstract: 本发明提供一种支持动态神经网络稀疏模型的硬件加速器架构,包括:程序系统端存储器存储的激活数据依次经过CPU和数据搬移模块,输入至第一核心模块;第一核心模块用于基于其预先存储的第一权重参数和激活数据,计算显著图并输出至所述第二核心模块;程序系统端存储器存储的激活数据和第二权重参数依次经过CPU和数据搬移模块,输入至第二核心模块;第二核心模块用于基于第二权重参数、激活数据和显著图计算模型结果,第一权重参数为显著图计算网络中的权重参数,第二权重参数为结合显著度的稀疏卷积网络的权重参数,第二权重参数基于预设时序多次分批输入第二核心模块。本发明提供的架构,实现了降低算法应用过程中计算耗时提高了效率。
-
公开(公告)号:CN110441730B
公开(公告)日:2021-09-03
申请号:CN201910600679.0
申请日:2019-07-04
Applicant: 清华大学
IPC: G01S3/805
Abstract: 本发明提供一种基于模拟信号处理架构的麦克风阵列声源定向系统,依次将麦克风阵列、模拟域声源定向处理模块和声源定向模块依次相连;基于互相关窗函数的广义互相关算法,采用模拟域声源定向处理模块对麦克风阵列中的多个麦克风采集的多个模拟语音信号进行处理,先根据多个模拟语音信号中的每任意两个模拟语音信号判断出一个声源定向区域,从而获得声源方向可能来源的多个声源定向区域,最后通过声源定向模块从多个声源定向区域中判断出最终的声源方向。本发明无需采用ADC而大大降低了系统功耗,同时也不需要FFT或IFFT的处理步骤而大大降低了系统延迟,并且采用的模拟电路较为简单,降低了模拟电路的复杂度,具有较好的系统扩展性。
-
公开(公告)号:CN113140245A
公开(公告)日:2021-07-20
申请号:CN202110540242.X
申请日:2021-05-18
Applicant: 清华大学
IPC: G11C11/413 , G11C7/18 , G11C8/14 , G11C5/14
Abstract: 本公开涉及一种静态随机访问存储器及电子设备,所述存储器包括至少一个存储电路,所述存储电路包括:第一反相器、第二反相器、第一开关、第二开关、第三开关、第四开关、第五开关、字线、第一位线、第二位线、移位输入线及移位输出线,在所述电路工作在第一模式的情况下,所述电路用于利用所述第一位线和/或所述第二位线存取数据;或在所述电路工作在第二模式的情况下,所述电路用于对所述移位输入线输入的数据进行移位,并通过所述移位输出线输出移位后的数据。本公开实施例通过在存储器内部实现移位输入及输出,能够完成高并发度的数据存取和更新,并且具有高集成度、低功耗的特点。
-
公开(公告)号:CN113096710A
公开(公告)日:2021-07-09
申请号:CN202110467990.X
申请日:2021-04-28
Applicant: 清华大学
Abstract: 本发明公开了一种单元电路及其动态三态内容寻址存储器。单元电路包括:写操作开关,纳米机电继电器和搜索操作开关。纳米机电继电器包括栅极、漏极和源极,其中漏极和源极之间的通断状态或阻抗状态用来表示所存储的数据。写操作开关与所述纳米机电继电器的栅极连接,以对纳米机电继电器内存储的信息进行写操作;搜索操作开关与纳米机电继电器的漏极或源极连接,用于检测输入数据是否与所述纳米机电继电器内存储的数据匹配。本发明利用纳米机电继电器有效降低了三态内容寻址存储器的写操作功耗,同时提高了三态内容寻址存储器的能量效率,是一类低功耗低延时的动态三态内容寻址存储器。
-
-
-
-
-
-
-
-
-