-
公开(公告)号:CN116991910A
公开(公告)日:2023-11-03
申请号:CN202210447052.8
申请日:2022-04-26
IPC: G06F16/2458 , G06F16/2453 , G06F16/22 , G06F16/2455
Abstract: 本申请公开了一种数据处理装置的控制方法和装置,能够降低处理时间。该方法包括:获取两个目标数据组,该两个目标数据组分别为两个数据集合中第一个数据组,其中第一数据集合中第一数据组为多个,数据集合中任一个数据组的关键值均小于位于该任一个数据组之后的数据组中各个所述关键值,在第一目标数据组最大关键值小于或等于第二目标数据组最大关键值的情况下,将位于第一目标数据组的下一个第一数据组作为第一目标数据组。从而,能够降低运算量,提高运算效率。
-
公开(公告)号:CN118860328A
公开(公告)日:2024-10-29
申请号:CN202411111200.4
申请日:2024-08-13
Applicant: 清华大学
Abstract: 本公开涉及存算一体技术领域,尤其涉及一种面向存算一体架构的非均匀数值表示方法、装置及存储介质。所述方法包括:获取预训练模型的权重值,权重值以二进制编码形式存储在存算一体架构的非易失性存储器的交叉阵列中;确定权重值对应的第一调控因子,第一调控因子包括比特级的浮点型调控因子,第一调控因子用于指示权重值与权重值对应的二进制编码数值之间的非均匀映射关系;将第一调控因子进行整型对齐得到对应的第二调控因子和浮点数因子,第二调控因子包括比特级的整型调控因子。本公开实施例设计了适合存算一体架构的非均匀数值表示方式,在不引入额外硬件负担的同时,提高模拟域的存算一体架构对于神经网络模型的计算精度。
-
公开(公告)号:CN119312883A
公开(公告)日:2025-01-14
申请号:CN202411356461.2
申请日:2024-09-26
Applicant: 清华大学
IPC: G06N3/10 , G06N3/0985 , G06F15/78
Abstract: 本公开涉及计算机技术领域,包括一种神经网络的算子融合策略的确定方法、装置及存储介质。通过确定单个算子按照不同计算方式进行计算时的片外访存参数,得到满足片上缓存约束的第一片外访存参数;对于多个算子中具有可融合关系的每组算子组,确定算子组融合后通过不同计算方式进行计算时的片外访存参数,得到满足片上缓存约束的第二片外访存参数;基于算子组中各个算子的第一片外访存参数、以及该算子组的第二片外访存参数,确定算子组的融合收益;将融合收益最大的算子组进行算子融合;循环遍历查找融合收益最大的算子组,可以在未设计出硬件平台的情况下,确定出算子融合策略;提高算子融合策略的确定方法的通用性和灵活性。
-
公开(公告)号:CN114707648A
公开(公告)日:2022-07-05
申请号:CN202210267969.X
申请日:2022-03-17
Applicant: 清华大学
Abstract: 本发明公开了一种基于存内计算的图卷积网络软硬件协同加速方法,该方法包括:在软件方面,通过量化定点方式,将图数据的高位宽的浮点数转化为低位宽的定点数,将图数据的原始图分割成多个子图得到聚类结果,并将多个子图的节点特征映射到用于特征聚合的RRAM交叉阵列上,再使用边删除方式将聚类结果中连接不同子图的边删除,以将图数据部署到硬件上;在硬件方面,配置计算模块和控制模块,其中,计算模块包括:聚合核阵列、向量组合阵列和中间缓存,控制模块包括:指令队列、图数据解码器和邻居缓存;通过软件方面和硬件方面的协同设计,实现图卷积网络GCN计算的加速。本发明提升了计算的并行度、架构的吞吐率和硬件的资源利用率。
-
公开(公告)号:CN110765710B
公开(公告)日:2021-11-30
申请号:CN201911005612.9
申请日:2019-10-22
Applicant: 清华大学
IPC: G06F30/327
Abstract: 本发明公开了一种基于非易失器件的通用逻辑综合方法及装置,其中,该方法包括:获取基础逻辑门描述文件和电路描述文件,将基础逻辑门描述文件和电路描述文件输入开源电路综合工具中进行编译生成基础逻辑门网表文件;根据映射规则生成器和基础逻辑门描述文件生成逻辑门位置约束关系,以逻辑门位置约束关系、基础逻辑门网表文件和实际内存约束为约束条件,以最小延迟为优化目标,输入优化求解器进行优化,生成优化结果。该方法可以对任何非易失基本逻辑实现方案进行逻辑综合,在逻辑实现层面考虑物理内存限制及延时、能效优化,并进一步对逻辑综合工具的运行时间进行加速优化。
-
公开(公告)号:CN119903217A
公开(公告)日:2025-04-29
申请号:CN202311427572.3
申请日:2023-10-28
IPC: G06F16/903 , G06F16/901
Abstract: 本申请公开了一种向量检索方法、装置、设备及存储介质,属于数据处理技术领域。所述方法包括:根据访问优先级队列预测多个搜索起始点,所述搜索起始点为所述访问优先级队列中未遍历邻居节点的节点;从内存中预取所述多个搜索起始点对应的邻居节点的特征向量;基于第一类搜索起始点对应的邻居节点的特征向量,对所述访问优先级队列进行更新,所述第一类搜索起始点为所述多个搜索起始点中已预取到邻居节点的特征向量的搜索起始点;若更新后的访问优先级队列满足检索结束条件,则基于所述更新后的访问优先级队列,输出所述查询向量的向量检索结果。本申请通过预测多个搜索起始点,提高了访问优先级队列的更新频率,进而提升了向量检索性能。
-
公开(公告)号:CN110765710A
公开(公告)日:2020-02-07
申请号:CN201911005612.9
申请日:2019-10-22
Applicant: 清华大学
IPC: G06F30/327
Abstract: 本发明公开了一种基于非易失器件的通用逻辑综合方法及装置,其中,该方法包括:获取基础逻辑门描述文件和电路描述文件,将基础逻辑门描述文件和电路描述文件输入开源电路综合工具中进行编译生成基础逻辑门网表文件;根据映射规则生成器和基础逻辑门描述文件生成逻辑门位置约束关系,以逻辑门位置约束关系、基础逻辑门网表文件和实际内存约束为约束条件,以最小延迟为优化目标,输入优化求解器进行优化,生成优化结果。该方法可以对任何非易失基本逻辑实现方案进行逻辑综合,在逻辑实现层面考虑物理内存限制及延时、能效优化,并进一步对逻辑综合工具的运行时间进行加速优化。
-
公开(公告)号:CN115293341A
公开(公告)日:2022-11-04
申请号:CN202210226668.2
申请日:2022-03-09
Applicant: 清华大学
Abstract: 本申请涉及软硬件联合设计技术领域,特别涉及一种面向存算一体架构的软硬件联合搜索方法、装置及设备,其中,方法包括:获取存算一体架构的多组设计参数和每组设计参数的所有可能取值,并对所有可能取值进行组合,生成软硬件联合设计空间;在搜索开始时,构造种群,并采用多轮迭代的方式对联合设计空间进行搜索,得到满足待优化目标的候选设计参数,基于候选设计参数对种群进行更新,并利用种群中每个候选设计参数的优先级裁剪联合设计空间,且在裁剪后的联合设计空间中,搜索满足待优化目标的目标设计参数,并基于目标设计参数生成目标网络模型和目标硬件架构。由此,能够实现对于网络模型和硬件架构的联合高效设计,避免了繁琐的手工优化。
-
公开(公告)号:CN101562482B
公开(公告)日:2011-09-14
申请号:CN200910082763.4
申请日:2009-04-28
Applicant: 清华大学
Abstract: 本发明涉及一种光纤无线通信系统及其下行链路多业务毫米波的产生方法,该系统包括中心站以及基站,中心站包括:光源,用于产生单一波长的光信号;第一调制模块,用射频信号对所述光信号进行光学载波抑制调制,生成两个光学载波信号;第二调制模块,用射频信号和携带有数据信息的中频信号对两个光学载波信号进行光学单边带载波抑制调制,生成射频光学输出信号;基站通过光纤与中心站连接,包括:滤波模块,滤除射频光学输出信号中不需要的中间分量;光电转换模块,对滤波模块输出的光信号进行光电转换,输出多业务毫米波。本发明的系统及方法结构简单、性能可靠、成本低廉。
-
公开(公告)号:CN101562482A
公开(公告)日:2009-10-21
申请号:CN200910082763.4
申请日:2009-04-28
Applicant: 清华大学
Abstract: 本发明涉及一种光纤无线通信系统及其下行链路多业务毫米波的产生方法,该系统包括中心站以及基站,中心站包括:光源,用于产生单一波长的光信号;第一调制模块,用射频信号对所述光信号进行光学载波抑制调制,生成两个光学载波信号;第二调制模块,用射频信号和携带有数据信息的中频信号对两个光学载波信号进行光学单边带载波抑制调制,生成射频光学输出信号;基站通过光纤与中心站连接,包括:滤波模块,滤除射频光学输出信号中不需要的中间分量;光电转换模块,对滤波模块输出的光信号进行光电转换,输出多业务毫米波。本发明的系统及方法结构简单、性能可靠、成本低廉。
-
-
-
-
-
-
-
-
-